词向量和语义知识相结合的汉语未登录词语义预测研究*
魏庭新,柏文雷,曲维光

Sense Prediction for Chinese OOV Based on Word Embedding and Semantic Knowledge
Wei Tingxin,Bai Wenlei,Qu Weiguang
表5 词向量+中心词模型与各基线模型语义预测结果
Table 5 Prediction Results of Embedding+Centro Model and Baseline Models
模型 有语义返回词数 正确数 正确率(%)
GloVe100 2 133 520 24.4
GloVe100+中心词 1 448 1 135 78.4
GloVe200+中心词 1 516 1 181 77.9
CBOW100 2 542 593 23.3
CBOW100+中心词 1 617 1 328 82.1
CBOW200+中心词 1 657 1 353 81.7
Skip-Gram100 2 389 712 29.8
Skip-Gram100+中心词 1 607 1 353 84.2
Skip-Gram200+中心词 1 622 1 339 82.6
☆基线模型 2 971 1 995 67.1