基于维基百科的多种类型文献自动分类研究*
李湘东, 阮涛, 刘康

Automatic Classification of Documents from Wikipedia
Li Xiangdong,Ruan Tao,Liu Kang
表3 语义相似度计算结果
特征词 扩展特征词及语义相关度
市场 交易:0.102 金融市场:0.211 劳动力市场:0.212
批发:0.224
股东 股票市场:0.146
净利润 资金:0.111 增长率:0.136 市场化:0.108
负债:0.172
女排 排球:1.000
王宝泉 袁伟民:0.115
亚军 冠军:0.709 金牌:0.106 银牌:0.274
环境监测 污染:0.346 污染物:0.100 富营养化:0.148
凝固 蒸发:0.288
污水处理 水质:0.173 水污染:0.357 生活污水:0.112