基于多特征融合的中文文本分类研究
*
王艳,王胡燕,余本功
Chinese Text Classification with Feature Fusion
Wang Yan,Wang Huyan,Yu Bengong
表2
数据集信息
Table 2
Data Set
数据项
计算机专利
搜狗新闻
来源
SooPAR专利
搜狗实验室开源
类别数
5
5
数量
10 000
10 000
平均长度(字符)
210
843
最短长度(字符)
150
30
最长长度(字符)
300
400