基于多特征融合的中文文本分类研究*
王艳,王胡燕,余本功

Chinese Text Classification with Feature Fusion
Wang Yan,Wang Huyan,Yu Bengong
表2 数据集信息
Table 2 Data Set
数据项 计算机专利 搜狗新闻
来源 SooPAR专利 搜狗实验室开源
类别数 5 5
数量 10 000 10 000
平均长度(字符) 210 843
最短长度(字符) 150 30
最长长度(字符) 300 400