中文文本聚类常用停用词表对比研究*
官琴, 邓三鸿, 王昊

Chinese Stopwords for Text Clustering: A Comparative Study
Guan Qin,Deng Sanhong,Wang Hao
表11 各语料库文本聚类效果平均值
复旦 搜狗 中文 平均值
百度 0.814 0.632 0.700 0.715
四川大学 0.812 0.439 0.734 0.662
哈尔滨工业大学 0.816 0.576 0.551 0.648