%A 张琴, 郭红梅, 张智雄 %T 融合词嵌入表示特征的实体关系抽取方法研究* %0 Journal Article %D 2017 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2017.09.01 %P 8-15 %V 1 %N 9 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4424.shtml} %8 2017-09-25 %X

目的】为解决已有方法中单词特征表示不具有语义信息这一问题, 对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征, 利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验, 并选出代表全部特征的有效特征子集。【结果】使用全部特征时, 决策树算法的准确率达到0.48, 关系抽取效果最佳, Member-Collection(E2,E1)类型关系的F1值达到0.70, 特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高, 以及词向量训练及方法的相关参数需要进一步优化。【结论】实验证明选取的三种类型特征的有效性, 词嵌入表示级别特征在实体关系抽取问题中可以发挥重要作用。