%A 胡家珩, 岑咏华, 吴承尧 %T 基于深度学习的领域情感词典自动构建*——以金融领域为例 %0 Journal Article %D 2018 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2018.0169 %P 95-102 %V 2 %N 10 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4570.shtml} %8 2018-10-25 %X

【目的】为特定领域情感分析任务构建一个适用的情感词典。【方法】以金融领域为例, 结合语料库和知识库的特点, 提出一种全新的构建情感词典的方法: 利用词向量方法将文本信息映射到向量空间, 借助已有的通用情感词典, 自动标引训练语料, 按照9:1的比例构建训练集和预测集。使用Python构建深度神经网络分类器, 判断特定领域候选情感词的情感极性, 构成情感词典。【结果】本文构建的神经网络分类器的训练集准确度为95.02%, 预测集准确度为95.00%, 同时证明了利用本文方法所构建的情感词典在金融领域中的表现优于其他已有方法。【局限】抽取种子词的方法需要进一步优化。【结论】本文方法解决了训练神经网络分类器中训练语料不足的问题, 同时解决了词向量的语义相关性无法区分情感信息的问题。在构建面向特定领域情感词典上具有较好的表现, 为该领域其他研究提供参考依据。