基于KACC模型的文本分类研究
*
李钰曼,陈志泊,许福
Classifying Texts with KACC Model
Yuman Li,Zhibo Chen,Fu Xu
表2
语料库组成及分类
类别
数据集
训练集(篇)
测试集(篇)
合计词数(个)
文化
800
200
203.6万
娱乐
800
200
59.6万
历史
800
200
363.3万
军事
800
200
135.4万
文学
800
200
82.2万
合计词数(个)
677.3万
166.8万
844.1万