基于维基百科的多种类型文献自动分类研究
*
李湘东, 阮涛, 刘康
Automatic Classification of Documents from Wikipedia
Li Xiangdong,Ruan Tao,Liu Kang
表3
语义相似度计算结果
特征词
扩展特征词及语义相关度
市场
交易:0.102 金融市场:0.211 劳动力市场:0.212
批发:0.224
股东
股票市场:0.146
净利润
资金:0.111 增长率:0.136 市场化:0.108
负债:0.172
女排
排球:1.000
王宝泉
袁伟民:0.115
亚军
冠军:0.709 金牌:0.106 银牌:0.274
环境监测
污染:0.346 污染物:0.100 富营养化:0.148
凝固
蒸发:0.288
污水处理
水质:0.173 水污染:0.357 生活污水:0.112