Please wait a minute...
Advanced Search
数据分析与知识发现  2020, Vol. 4 Issue (8): 98-106     https://doi.org/10.11925/infotech.2096-3467.2019.1243
     研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于情感膨胀门控CNN的情感-原因对提取*
代建华1,2,3(),邓育彬1,3
1湖南师范大学智能计算与语言信息处理湖南省重点实验室 长沙 410081
2湖南师范大学语言与文化研究院 长沙 410081
3湖南师范大学信息科学与工程学院 长沙 410081
Extracting Emotion-Cause Pairs Based on Emotional Dilation Gated CNN
Dai Jianhua1,2,3(),Deng Yubin1,3
1Hunan Provincial Key Laboratory of Intelligent Computing and Language Information Processing, Hunan Normal University, Changsha 410081, China
2Research Institute of Languages and Cultures, Hunan Normal University, Changsha 410081, China
3College of Information Science and Engineering, Hunan Normal University, Changsha 410081, China
全文: PDF (1011 KB)   HTML ( 6
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 针对情感-原因对抽取这一情感分析任务,提出情感膨胀门控CNN(EDGCNN)模型。【方法】首先使用情感判别模型CNN找出情感句,然后将情感句编码输入到融入情感特征的EDGCNN模型,找出相应的情感原因,得到情感-原因对,并在实验数据集进行情感原因关键字标注。【结果】召回率和F1值分别达到了63.52%和60.45%,召回率优于已有方法最好结果,F1值与已有方法最优性能相当,而且能从更细粒度实现情感-原因对抽取。【局限】情感-原因对语料规模较小,有待进一步扩充完善。【结论】EDGCNN模型能够从文本中更好地抽取情感-原因对。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
代建华
邓育彬
关键词 情感-原因对抽取EDGCNN情感判别    
Abstract

[Objective] This paper proposes an Emotional Dilation Gated CNN (EDGCNN) model, aiming to extract emotion-cause pairs for sentiment analysis. [Methods] First, we used the emotional discriminant model to identify sentiment sentences. Then, we input coding for these sentences to the EDGCNN model and located corresponding reasons. Finally, we tagged keywords of reasons generated from the experimental dataset. [Results] The new model’s recall and F1 values reached 63.52% and 60.45% respectively on the training dataset, which were better or very similiar to the existing ones The proposed model also extracted emotion-cause pairs at finergranularity level. [Limitations] The experimental corpus size was small. [Conclusions] The proposed model can extract emotion-cause pairs effectively.

Key wordsEmotion-Cause Pair Extraction    EDGCNN    Emotion Discrimination
收稿日期: 2019-11-14      出版日期: 2020-06-05
ZTFLH:  TP391  
基金资助:*本文系湖南省科技创新计划项目"湖湘高层次人才聚集工程-创新人才"(2018RS3065);"智能计算与语言信息处理湖南省重点实验室"的研究成果之一(2018TP1018)
通讯作者: 代建华     E-mail: baoping@njau.edu.cn
引用本文:   
代建华, 邓育彬. 基于情感膨胀门控CNN的情感-原因对提取*[J]. 数据分析与知识发现, 2020, 4(8): 98-106.
Dai Jianhua, Deng Yubin. Extracting Emotion-Cause Pairs Based on Emotional Dilation Gated CNN. Data Analysis and Knowledge Discovery, 2020, 4(8): 98-106.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2019.1243      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2020/V4/I8/98
Fig.1  ECPE任务例子
Fig.2  实验思路
Fig.3  情感语句判别模型
Fig.4  情感-原因对提取模型
Fig.5  膨胀卷积神经网络
数据集 数量 比例
只有一对情感-原因对的文本 1 746 89.77%
有两对情感-原因对的文本 177 9.10%
超过两对情感-原因对的文本 22 1.13%
总计 1 945 100%
Table 1  具有不同情感-原因对数量的文档的比例
Fig.6  情感原因关键字标注示例
实验模型 情感句判别结果
P R F1
CNN 0.734 0 0.876 9 0.799 1
LSTM 0.674 4 0.824 6 0.741 9
Table 2  情感句判别结果
实验模型 情感原因对提取结果
P R F1
Indep 0.683 2 0.508 2 0.581 8
Inter-CE 0.690 2 0.513 5 0.590 1
Inter-EC 0.672 1 0.570 5 0.612 8
EDGCNN 0.575 8 0.635 2 0.604 5
Table 3  实验结果对比
文本中部分语句 情感句 EDGCNN
输出
情感-
原因对
8,null,白金跃陷入回忆
9,happiness,并略显激动
9 跃陷入回忆 9-8
3,happiness,她为自己再过几天就可基本康复出院而感到高兴 3 康复出院 3-3
4,happiness,让郭惠英感动的是
5,null,她醒来时
6,null,还有一位民警守在身边
4 民警守在身边 4-6
1,null,每当在新闻上看到血库告急的消息
2,fear,刘淑梅就很焦虑
2 血库告急的消息 1-2
6,null,当唐某向张某提出离婚后被拒
7,disgust,怨恨转化成杀意
7 提出离婚 7-6
19,null,汤某也完全站在女儿一边数落女婿
20,anger,这让陈晓毅很是气愤
20 数落女婿 20-19
Table 4  EDGCNN模型部分实验结果
[1] Rout J K, Choo K K R, Dash A K, et al. A Model for Sentiment and Emotion Analysis of Unstructured Social Media Text[J]. Electronic Commerce Research, 2018,18:181-199.
doi: 10.1007/s10660-017-9257-8
[2] Peng M L, Zhang Q, Jiang Y G, et al. Cross-Domain Sentiment Classification with Target Domain Specific Information[C]// Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics.Melbourne, Australia, 2018: 2505-2513.
[3] 刘全, 梁斌, 徐进, 等. 一种基于方面情感分析的深度分层网络模型[J]. 计算机学报, 2018,41(12):2637-2652.
[3] ( Liu Quan, Liang Bin, Xu Jin, et al. A Deep Layered Network Model for Aspect-Based Sentiment Analysis[J]. Chinese Journal of Computers, 2018,41(12):2637-2652.)
[4] 张庆庆, 贺兴时, 王慧敏, 等. 基于深度信念网络的文本情感分类研究[J]. 数据分析与知识发现, 2019,3(4):71-79.
[4] ( Zhang Qingqing, He Xingshi, Wang Huimin, et al. Text Sentiment Classification Based on Deep Belief Network[J]. Data Analysis and Knowledge Discovery, 2019,3(4):71-79.)
[5] Chen Y, Hou W J, Cheng X Y, et al. Joint Learning for Emotion Classification and Emotion Cause Detection[C]// Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. 2018: 646-651.
[6] Li X J, Feng S, Wang D L, et al. Context-Aware Emotion Cause Analysis with Multi-Attention-Based Neural Network[J]. Knowledge-Based Systems, 2019,174:205-218.
doi: 10.1016/j.knosys.2019.03.008
[7] Lee S Y M, Chen Y, Huang C R, et al. Detecting Emotion Causes with a Linguistic Rule-Based Approach[J]. Computational Intelligence, 2013,29(3):390-416.
doi: 10.1111/j.1467-8640.2012.00459.x
[8] Yada S, Ikeda K, Hoashi K, et al. A Bootstrap Method for Automatic Rule Acquisition on Emotion Cause Extraction[C]// Proceedings of 2017 IEEE International Conference on Data Mining Workshops. IEEE, 2017: 414-421.
[9] Gao K, Xu H, Wang J S. A Rule-Based Approach to Emotion Cause Detection for Chinese Micro-Blogs[J]. Expert Systems with Applications, 2015,42(9):4517-4528.
doi: 10.1016/j.eswa.2015.01.064
[10] Chen Y, Hou W J, Cheng X Y. Hierarchical Convolution Neural Network for Emotion Cause Detection on Microblogs[C]// Proceedings of the 27th International Conference on Artificial Neural Networks. 2018: 115-122.
[11] Gui L, Hu J N, He Y L, et al. A Question Answering Approach for Emotion Cause Extraction[C]// Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing. 2017: 1593-1602.
[12] Weston J, Chopra S, Bordes A. Memory Networks[OL]. arXiv Preprint, arXiv: 1410.3916.
[13] Yu X Y, Rong W G, Zhang Z, et al. Multiple Level Hierarchical Network-Based Clause Selection for Emotion Cause Extraction[J]. IEEE Access, 2019,7:9071-9079.
doi: 10.1109/ACCESS.2018.2890390
[14] Xia R, Ding Z X. Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts[C]// Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. 2019: 1003-1012.
[15] 苏剑林. 基于CNN的阅读理解式问答模型[EB/OL]. [2018-04-15].https://spaces.ac.cn/archives/5409.
[15] ( Su Jianlin. CNN Based Reading Comprehension Question and Answer Model[EB/OL]. [2018-04-15].https://spaces.ac.cn/archives/5409.
[16] Kim Y. Convolutional Neural Networks for Sentence Classification[C]// Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. 2014: 1746-1751.
[17] Laskar Z, Kannala J. Context Aware Query Image Representation for Particular Object Retrieval[C]// Proceedings of Scandinavian Conference on Image Analysis. 2017: 88-99.
[18] Dauphin Y N, Fan A, Auli M, et al. Language Modeling with Gated Convolutional Networks[C]// Proceedings of the 34th International Conference on Machine Learning. 2017: 933-941.
[19] Wang W H, Yang N, Wei F R, et al. Gated Self-Matching Networks for Reading Comprehension and Question Answering[C]// Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics. 2017: 189-198.
[20] Lin T Y, Goyal P, Girshick R, et al. Focal Loss for Dense Object Detection[C]// Proceedings of the IEEE International Conference on Computer Vision. 2017: 2980-2988.
[21] Li S, Zhao Z, Hu R F, et al. Analogical Reasoning on Chinese Morphological and Semantic Relations[C]// Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. 2018: 138-143.
[22] Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural Computation, 1997,9(8):1735-1780.
doi: 10.1162/neco.1997.9.8.1735 pmid: 9377276
[1] 余本功, 朱梦迪. 基于层级注意力多通道卷积双向GRU的问题分类研究*[J]. 数据分析与知识发现, 2020, 4(8): 50-62.
[2] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
[3] 王思丽, 祝忠明, 杨恒, 刘巍. 基于模式和投影学习的领域概念上下位关系自动识别研究 [J]. 数据分析与知识发现, 0, (): 1-.
[4] 翁梦娟,姚长青,韩红旗,王莉军,冉亚鑫. 不均衡数据集下基于CNN的中图分类标引方法 *[J]. 数据分析与知识发现, 2020, 4(7): 87-95.
[5] 唐晓波,高和璇. 基于关键词词向量特征扩展的健康问句分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 66-75.
[6] 邱尔丽,何鸿魏,易成岐,李慧颖. 基于字符级CNN技术的公共政策网民支持度研究 *[J]. 数据分析与知识发现, 2020, 4(7): 28-37.
[7] 王建冬,于施洋. 构建国家经济大脑的实践探索与初步设想 *[J]. 数据分析与知识发现, 2020, 4(7): 2-17.
[8] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[9] 李广建, 王锴, 张庆芝. 基于多源数据的美国出口管制分析框架及其实证研究 [J]. 数据分析与知识发现, 0, (): 1-.
[10] 邵琦, 牟冬梅, 王萍, 靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究 [J]. 数据分析与知识发现, 0, (): 1-.
[11] 李轲禹,王昊,龚丽娟,唐慧慧. 学术数据库中研究主题术语的质量测度及分布研究*[J]. 数据分析与知识发现, 2020, 4(6): 91-108.
[12] 魏庭新,柏文雷,曲维光. 词向量和语义知识相结合的汉语未登录词语义预测研究*[J]. 数据分析与知识发现, 2020, 4(6): 109-117.
[13] 杨恒,王思丽,祝忠明,刘巍,王楠. 基于并行协同过滤算法的领域知识推荐模型研究*[J]. 数据分析与知识发现, 2020, 4(6): 15-21.
[14] 焦启航,乐小虬. 对比关系句子生成方法研究[J]. 数据分析与知识发现, 2020, 4(6): 43-50.
[15] 蔡永明,刘璐,王科唯. 网络虚拟学习社区重要用户与核心主题联合分析*[J]. 数据分析与知识发现, 2020, 4(6): 69-79.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn