数据分析与知识发现  2023, Vol. 7 Issue (2): 72-85
1华中科技大学同济医学院医药卫生管理学院 武汉 430030
2湖北省卫生技术评估研究中心 武汉 430030
A Fine-Grained Sentiment Recognition Method Based on OCC Model and Triggering Events
Shen Lining1,2(),Yang Jiayi1,Pei Jiaxuan1,Cao Guang1,Chen Gongzheng1
1School of Medicine and Health Management, Tongji Medical College, Huazhong University of Science and Technology, Wuhan 430030, China
2Hubei Provincial Research Center for Health Technology Assessment, Wuhan 430030, China
全文: PDF (1463 KB)   HTML ( 21
目的】 从情绪诱因事件角度丰富传统细颗粒度情绪分析中的事件逻辑。【方法】 分析OCC模型中的情绪生成规则和条件,利用事件抽取和文本分类方法生成<事件,情绪>二元组。【结果】 研究构建了情绪生成规则,情绪类别划分具有理论基础。模型能够有效识别情绪诱因事件(F1=0.933 8)及情绪(F1=0.963 7),生成<事件,情绪>二元组(F1=0.889 2),实现事件级细颗粒度情绪分析。【局限】 情绪生成规则结构简单,难以体现网民情绪的多样性。现阶段构建的语料集存在领域局限性,每条语料只包含一种类型情绪诱因事件。【结论】 借助OCC模型将事件评价和情绪相关联,让情绪识别更接近人类思维方式。模型的理解性和迁移性较强,提升了现有研究中情绪对象的粒度层次,为文本情绪分析领域研究提供新思路。

关键词 OCC模型细颗粒度情绪分析情绪诱因事件抽取深度学习    

[Objective] This paper tries to enrich the event logic of traditional fine-grained sentiment analysis from the perspective of emotion-triggering events. [Methods] We analyzed the OCC model’s sentiment generation rules and conditions to create the <event, sentiment> binary groups using event extraction and text classification methods. [Results] The proposed model constructed rules for emotion generation and built a theoretical basis for classifying sentiments. The model effectively identified emotion-triggering events (F1=0.933 8) and sentiments (F1=0.963 7). It generated <event, sentiment> binary groups (F1=0.889 2) to realize event-level fine-grained sentiment analysis. [Limitations] The structure of sentiment generation rules is simple and cannot reflect the diversity of netizens’ emotions. The corpus built at present has domain limitations and each corpus only contains one type of emotion-triggering event. [Conclusions] By associating event evaluations and emotions with the help of the OCC model, our new model becomes more in line with human thinking. The model has good interpretability and transferability, which enhances the granularity level of emotional objects in existing studies. It provides new ideas for research in the field of textual sentiment analysis.

Key wordsOCC Model    Fine-Grained Sentiment Analysis    Emotion-Triggering    Event Extraction    Deep Learning
收稿日期: 2022-09-13      出版日期: 2023-03-28
ZTFLH:  TP391  
通讯作者: 沈丽宁,ORCID:0000-0002-7311-8777,。   
沈丽宁, 杨佳艺, 裴家旋, 曹广, 陈功正. 基于OCC模型和情绪诱因事件抽取的细颗粒度情绪识别方法研究*[J]. 数据分析与知识发现, 2023, 7(2): 72-85.
Shen Lining, Yang Jiayi, Pei Jiaxuan, Cao Guang, Chen Gongzheng. A Fine-Grained Sentiment Recognition Method Based on OCC Model and Triggering Events. Data Analysis and Knowledge Discovery, 2023, 7(2): 72-85.
Fig.1  基于OCC模型的情绪生成规则
Fig.2  基于 OCC模型和情绪诱因事件抽取的细颗粒度情绪识别方法研究框架
情绪诱因事件类型 论元角色
事件结果 主体、结果
主体行为 主体、行为
Table 1  情绪诱因事件类型及论元角色
Fig.3  情绪诱因事件抽取模型
Fig.4  文本期望分类模型
评估标准 细分 解释
目标 主动
实现目标 实现某些东西
娱乐目标 享受某些东西
工具目标 本身是积极追求的,就像实现目标一样
危机目标 为了避免对保护目标的威胁
保存目标 人们希望看到发生的事情,保存目标是一种特殊情况,因为它们代表一个人在保存某些有价值的事务状态方面的利益
标准 各种道德的、法律的和传统的法律、规则、条例、规范以及行为和表现的规范
Table 2  期望评估原则
Fig.5  事件与情绪二元组生成
账户 内容 时间
宾县发布 【#武大靖为家乡修公益冰场#】能够为家乡的冰雪运动献出一份力,让更多热爱冰雪运动的孩子可以参与进来,这一直是武大靖的心愿。 2022.02.23
北京2022年冬奥会#北京冬奥##隋文静韩聪#开始和结尾都看了直播!运动员们真的好不容易。【#文在寅#发文祝贺冬奥韩国选手:都是赢家】#北京冬奥#韩国总统文在寅20日在个人社交网站发文,向每一位在2022北京冬奥会上拼尽全力的韩国运动员致敬,称赞他们都是了不起的胜利者。 2022.02.20
江山鼎球 2022年2月17日晚,15岁的俄罗斯女孩卡米拉·瓦利耶娃(KamilaValieva)在泪水中结束了自己的#北京冬奥#之旅。 2022.02.18
Table 3  北京冬奥会微博文本示例
事件类型 数量 论元角色 数量
事件结果 736 主体 1 244
结果 1 192
主体行为 266 主体 293
行为 288
Table 4  情绪诱因事件标注集
文本期望类别 数量
Table 5  文本期望标注集
情绪 数量
喜悦 447
悲伤 289
赞赏 233
指责 33
Table 6  情绪标注集
模型 参数 取值
BERT-BiLSTM-CRF Optimizer adam
Batch_size 128
Max_seq_len 128
Clip 5.0
Dropout 0.5
Learning_rate 0.001
TextCNN Embedding 200
Dropout 0.5
Batch_size 128
Max_seq_len 128
Channels 256
Learning_rate 0.001
Table 7  实验参数设置
类别 模型 精确率 召回率 F1值
情绪诱因事件抽取模型 BERT-BiLSTM-CRF 0.928 6 0.949 2 0.938 8
BiLSTM-CRF 0.680 4 0.706 8 0.693 3
文本期望分类模型 TextCNN 0.946 1 0.945 0 0.944 2
SVM 0.943 7 0.944 2 0.943 6
FastText 0.921 0 0.921 9 0.921 2
Table 8  模型结果对比分析
情绪诱因事件类型 精确率 召回率 F1值
事件结果 0.986 3 0.973 1 0.979 7
主体行为 1 0.924 5 0.960 7
平均 0.993 1 0.948 8 0.970 2
Table 9  不同情绪诱因事件类型抽取结果
情绪诱因事件类型 论元角色 精确率 召回率 F1值
事件结果 主体 0.949 5 0.988 7 0.968 7
结果 0.917 3 0.947 2 0.932 0
主体行为 主体 0.910 7 0.864 4 0.887 0
行为 0.894 7 0.864 4 0.879 3
平均 0.928 6 0.949 2 0.938 8
Table 10  不同论元角色抽取结果
Fig.6  主体行为类事件论元关系图谱(部分)
Fig.7  事件结果类事件论元关系图谱(部分)
文本期望类别 精确率 召回率 F1值
0.935 3 0.984 8 0.959 4
0.967 2 0.867 6 0.914 7
平均 0.946 1 0.945 0 0.944 2
Table 11  文本期望分类结果
情绪类别 精确率 召回率 F1值
喜悦 0.934 0 0.988 3 0.960 4
悲伤 0.981 8 0.900 0 0.939 1
赞赏 1 0.914 8 0.955 5
指责 1 1 1
平均 0.978 9 0.950 8 0.963 7
Table 12  情绪分类结果
<事件,情绪>二元组 精确率 召回率 F1值
<(事件结果-主体,事件结果-结果),喜悦> 0.946 6 0.825 5 0.881 9
<(事件结果-主体,事件结果-结果),悲伤> 0.980 7 0.850 0 0.910 7
<(主体行为-主体,主体行为-行为),赞赏> 1 0.829 7 0.906 9
<(主体行为-主体,主体行为-行为),指责> 1 0.750 0 0.857 1
平均 0.981 8 0.813 8 0.889 2
Table 13  <事件,情绪>二元组识别结果
Full text



