基于KACC模型的文本分类研究 *
李钰曼,陈志泊,许福

Classifying Texts with KACC Model
Yuman Li,Zhibo Chen,Fu Xu
表2 语料库组成及分类
类别
数据集
训练集(篇) 测试集(篇) 合计词数(个)
文化 800 200 203.6万
娱乐 800 200 59.6万
历史 800 200 363.3万
军事 800 200 135.4万
文学 800 200 82.2万
合计词数(个) 677.3万 166.8万 844.1万