%A 范云杰, 刘怀亮 %T 基于维基百科的中文短文本分类研究 %0 Journal Article %D 2012 %J 数据分析与知识发现 %R 10.11925/infotech.1003-3513.2012.03.08 %P 47-52 %V 28 %N 3 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_3536.shtml} %8 2012-03-25 %X 针对中文短文本自身词汇个数少、描述信息弱的缺陷,引入特征扩展的方法辅助分类。借助网络知识库维基百科抽取相关概念,并采用统计规律与类别信息相结合的方式计算概念间相关度,建立语义相关概念集合,对短文本的特征向量进行扩展,从而有效补充短文本的语义特征。对比实验表明,基于维基百科的短文本分类方法能够提高短文本分类的效果。