面向微博商品评论的情感标签抽取研究 *

doi:10.11925/infotech.2096-3467.2018.1429

面向微博商品评论的情感标签抽取研究 ^*

李博诚¹, 张云秋^,^,¹, 杨铠西²

1 吉林大学公共卫生学院长春 130021

2 大连理工大学国际信息与软件学院大连 116620

Extracting Emotion Tags from Comments of Microblog Commodities

Li Bocheng¹, Zhang Yunqiu^,^,¹, Yang Kaixi²

1 College of Public Health, Jilin University, Changchun 130021, China

2 International School of Information Science & Engineering, Dalian University of Technology, Dalian 116620, China;

通讯作者: 张云秋, ORCID: 0000-0002-9790-9581, E-mail:yunqiu@jlu.edu.cn。

收稿日期: 2018-12-19 修回日期: 2019-05-8 网络出版日期: 2019-09-25

基金资助:

*本文系教育部人文社会科学研究项目规划基金项目“社交媒体环境下主体因素与信息行为关系的双向视角研究”. 项目编号: 18YJA870017
吉林省社会科学基金项目“基于细粒度分析的吉林省突发事件网民情感态势及演变规律研究”. 项目编号: 2019B59

Received: 2018-12-19 Revised: 2019-05-8 Online: 2019-09-25

摘要

【目的】提出新的情感标签抽取方法, 以提高微博商品评论的特征级情感标签抽取效果。【方法】基于依存句法分析并结合制定的抽取规则进行评价单元划分和显式标签抽取, 通过NodeRank算法揭示评论中的隐式表达关系, 进而抽取隐式标签, 提高情感标签抽取的正确率。【结果】通过真实的网络评论数据集进行模拟和对比实验, 本文方法的总体准确率、召回率、F值达到83.6%、87.1%和85.3%, 优于已有的抽取方法。【局限】在隐式标签的抽取中未能充分考虑用户较为通用的情感表达。【结论】本文所提基于依存句法分析和NodeRank算法的方法可以有效地对情感标签进行抽取。

关键词： 评论挖掘 ; 依存句法分析 ; NodeRank算法 ; 微博情感标签

Abstract

[Objective] This paper proposes a new method to collect emotion tags from microblog comments, aiming to improve the performance of feature-level data extraction. [Methods] First, we divided the evaluation units and extracted the explicit tags based on the dependency parsing and the extraction rules. Then, we revealed the implicit expression relationship in comments with the NodeRank algorithm. Finally, we retrieved the implicit tags to improve the accuracy of emotion tag retrieval. [Results] We examined the proposed method with the real online comments. The overall precision of the method was 83.6%, the recall rate was 87.1%, and the F value was 85.3%, which were better than the traditional methods. [Limitations] We did not fully utilize users’ general emotional expressions. [Conclusions] The proposed method based on dependency parsing and NodeRank algorithm can extract emotion tags effectively.

Keywords： Opinion Mining ; Dependency Syntax Analysis ; NodeRank Algorithms ; Microblog Emotional Tags

PDF (646KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

李博诚, 张云秋, 杨铠西. 面向微博商品评论的情感标签抽取研究 ^*. 数据分析与知识发现[J], 2019, 3(9): 115-123 doi:10.11925/infotech.2096-3467.2018.1429

Li Bocheng. Extracting Emotion Tags from Comments of Microblog Commodities. Data Analysis and Knowledge Discovery[J], 2019, 3(9): 115-123 doi:10.11925/infotech.2096-3467.2018.1429

1 引言

随着自媒体时代的来临, 微博已成为人们发表观点、表达情感的重要途经之一。中国互联网络信息中心(China Internet Network Information Center, CNNIC)发布的《第43次中国互联网络发展状况统计报告》显示: 截至2018年12月, 中国微博用户已达3.51亿^[1]。除对身边的新鲜事和社会热点事件进行评论外, 越来越多的微博用户开始发表自己对于某种产品或者服务的评价。微博商品评论作为社交媒体环境下的新型表现形式, 相较于传统电商平台评论往往较少涉及虚假评论以及刷单现象, 真实性更强^[2]。对其进行分析和挖掘, 可以更为准确地反映用户对于产品的态度。但受到发文字数的限制以及强交互性的影响, 微博评论的观点更加密集, 表达口语性更高, 分析难度也更大。因此, 面向微博的商品评论挖掘已逐渐成为文本分析领域的研究热点。

评论挖掘(Opinion Mining)指运用自然语言处理、文本分析等相关技术对网络中海量评论进行意见抽取的过程^[3], 可以确保在信息不失真的前提下, 从大量评论数据中提取有价值的内容, 并将其凝练为简洁、结构化的形式。评论挖掘的研究工作主要可以分为两个方面: 情感标签的抽取即评价对象与观点词关系的抽取; 观点词或句的情感极性计算。其中情感标签抽取效果直接影响到观点挖掘的粒度和情感极性计算的效果。因此本文重点围绕情感标签的抽取展开, 面向微博商品评论, 研究抽取产品评价对象与观点词之间对应关系的方法, 以生成基于特征评价的产品描述, 更好地为商家了解顾客需求、改进产品性能和服务以及为消费者高效地获取在线商品评论中的有效信息提供帮助^[4,5]。

2 相关研究

情感标签抽取可以分为两步: 评价单元的划分; 评价对象与评价短语关系的抽取。评价单元的划分是情感标签抽取工作的基础, 划分的优劣将直接影响后续抽取工作。目前评价单元划分的方法主要为以自然标点划分, 即通过人们日常使用的标点符号进行划分的方法^[6,7]和基于特征词表为切分依据的方法^[8,9]。然而这忽略了一个整句内各个小句之间的关系, 使得划分规则只具有较强的领域适用性而普适性较差, 且容易造成划分过细而导致评论短语提取不全或划分过粗而致使遗漏评价对象的现象。因此, 如何针对评论文本的特点进行基于语义层面的划分是提高划分准确度的关键。

评价对象与评价短语关系的抽取是整个情感标签抽取工作的核心, 在商品评论中评价对象(f)亦称特征词, 是评论的客体, 一般为产品的某个部件或是某个属性; 评价短语(s)则是用户主观感受的表达, 是用于形容评价对象的一个短句或者词组。如果一个评价对象f明确出现在评论文本r中, 那么f称为r的显式特征, f和其所对应的情感短语s所组成的情感标签<f,s>称为一个显式标签, 同理如果f没有在r中明确出现, 而是被暗指, 那么将f称为r的一个隐式特征, 此时这个被暗指的特征f和其所对应的情感短语s所组成的情感标签<f,s>称为一个隐式标签^[10]。现阶段显式标签抽取的方式主要有两种:

(1) 基于词表进行直接抽取, 包括词组模式^[11,12]、基于情感词典^[13,14]等方法。该方法不容易遗漏情感词, 但容易导致情感词与评价对象匹配错误。

(2) 基于评论对象的间接抽取, 包括基于共现规则的抽取方法^[15,16]、基于词性分析的抽取模型^[17,18,19]。该方法可以完成“评价对象-评价短语”意见对的抽取, 但目前相应抽取规则的覆盖率较低, 识别准确率还不够。

相对于显式标签, 隐式标签的提取则相对困难, 尤其在以微博为代表的新型网络社交媒体环境下, 由于其评论字数的限制以及用户间强交互性的影响, 具有内容复杂、口语性强和非结构化的特点^[20]。其中充斥着大量用户间约定俗成的隐式表达, 如在电子产品领域“发烫”往往修饰的是电池, 但用户一般较少使用“电池发烫”这样的语句, 而是直接使用“发烫”或者“有点发烫”进行评价, 这些使用习惯增加了特征提取的难度。隐式标签提取的主要思想是发现评价对象与情感词之间的搭配关系, 进而根据这些关系对评价对象进行有效的填补^[21], 发现方法包括基于TF-IDF算法^[22]、基于共词网络^[23]以及基于网络分析的TextRank算法^[24]。但这些方法都存在一些局限性, 如TF-IDF算法和共词网络考虑了特征词和情感词的频次但忽略了词与词之间的关系; 而TextRank算法构造的是无向无权网络, 并不能准确描述词与词之间出现的频次。因此, 如何更好地描述评价对象与情感词之间的关系, 进而发现其中的特殊搭配关系是研究的重点。

综上所述, 现阶段情感标签抽取的研究中还存在着以下局限:

(1) 评价单元划分的准确率不高;

(2) 显式标签抽取规则的覆盖率较低;

(3) 特征词与情感词关系的描述方式单一, 缺少多维高效的发现算法。

针对上述问题, 本文提出一种面向微博商品评论的情感标签抽取方法。该方法借助依存句法分析可以从语义层次上划分评价单元并进行显式标签的抽取, 通过NodeRank算法对评价对象与情感词之间的修饰关系进行综合描述, 进而提高对隐式表达的识别效果。利用新浪微博平台的真实评论数据对本文方法进行实证研究。

3 情感标签抽取框架

3.1 情感标签抽取框架概述

情感标签抽取框架如图1所示。针对现阶段情感标签抽取研究的局限性, 本文主要对情感标签的抽取流程作如下改进:

(1) 评价单元划分: 在自然标点分割的基础上, 考虑各个小句之间的关系, 增加依存链的辅助修正;

(2) 显式标签抽取: 在已有研究的基础上采用依存句法分析进行关系抽取并制定了更加详细的抽取规则;

(3) 隐式标签抽取: 采用基于二分加权网络的NodeRank算法, 建立特征词与情感词的无向有权网络来揭示特征词与情感词之间的特殊搭配关系, 进而提取隐式表达关系, 并利用WordSimilarity语义词典进行补充填补。

上述情感标签抽取的三个环节并不相互独立, 评价单元的准确划分为显式与隐式标签的抽取提供了基础, 在语义层面上的显式标签抽取不仅提高了自身的抽取正确率而且为隐式表达关系揭示提供了保障。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 情感标签抽取框架

3.2 基于依存关系的评价单元划分

句子的成分可以分为主语、谓语、宾语、定语等, 其间的结构又可以分为主谓、动宾、定中等结构。依存句法分析就是通过计算机技术识别句子中的成分以及成分关系的方法。

利用哈尔滨工业大学语言云平台对句子“表带很舒服”进行依存句法分析的结果如图2所示。在该依存关系中, 词与词之间存在一条依存链, 依存链箭头指向的一端为修饰词, 另一端为核心词。主要依存关系如表1所示。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 依存句法分析示意图

表1 本文涉及的主要依存关系表

依存关系	关系类型	示例
SBV	主谓关系	做工细腻(做工细腻)
ATT	定中关系	是个好手表(手表好)
COO	并列关系	外观和手感(外观手感)
VOB	动宾关系	可惜没有蜂窝网络(没有网络)
ADV	状中关系	外观非常漂亮(非常漂亮)
CMP	动补关系	心率监测一般(一般监测)
HED	核心关系	整句的核心

新窗口打开| 下载CSV

微博中的商品评论相对于传统电商平台评论更加灵活多变, 信息密度更高, 一条评论中可能包含对于同一商品多个特征的评价, 这些特征有些是显式的, 还有很多是隐式的。传统以自然标点或以特征词为切分依据的情感单元划分方法已不再适用。因此, 本文在已有研究^[7-8,25]基础上引入词间依存关系对评价单

元的划分规则进行重新定义, 以增强划分的准确性与完整性。将句号、分号、问号、感叹号这些表示句意结束的标点定义为强分隔符, 将逗号、顿号这些表示句意暂停的标点定义为弱分隔符。对于一个句子先按文中的标点进行切割, 对于弱分隔符使用依存链进行辅助纠正, 如果弱分隔符两边存在为COO(并列关系)、LAD(左附加关系)、RAD(右附加关系)的依存关系, 则取消该弱分隔符的分割作用, 将该依存链连接的两个小句合并。

评价单元提取示意图如图3所示, 评论“电池耗电一般, 能坚持3天”, 在语意上“能坚持3天”是对“耗电一般”的补充描述; 在句法结构上, COO依存关系跨越逗号连接了“电池耗电一般”和“能坚持3天”两个小句, “耗电”和“坚持”属并列结构同共同对“电池”进行修饰, 故在此取消逗号的分割作用, 将其合并作为一个评价单元处理。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 评价单元提取示意图

3.3 基于依存句法分析的显式标签抽取

采用<评价对象, 评价短语, 评价核心词>三元组的方式对评价集进行存储。其中, 评价对象是商品的某个部件或某个属性(如: 电池、价格); 评价短语为一组连续出现的词组, 由程度副词、否定词和评价核心词组合而成; 评价核心词是直接和评价对象产生依存关系的词。利用词性以及词对间的依存关系, 制定抽取规则如表2所示。

表2 依存关系抽取规则

依存关系	提取规则	说明
SBV	提取<SBV的修饰词, SBV核心词依存链扩展, SBV的核心词>	此时句中的主语为SBV的修饰词, 谓语为SBV的核心词
SBV+VOB	提取<SBV的修饰词, VOB全依存链扩展, VOB全依存链>	此时句中谓语既是SBV的核心词同时也是VOB的核心词
SBV+CMP	提取<SBV的修饰词, CMP全依存链扩展, CMP全依存链>	此时句中谓语既是SBV的核心词同时也是CMP的核心词
SBV+COO	提取<SBV的修饰词, SBV核心词依存链扩展, SBV的核心词>; <COO的修饰词, SBV核心词依存链扩展, SBV的核心词>	此时句中的主语由SBV的修饰词和COO的修饰词共同构成
VOB	提取<VOB的修饰词, VOB的核心词依存链扩展, VOB的核心词>	若VOB修饰词的POS=n或j且核心词的POS=v
VOB	提取<VOB的核心词, VOB的修饰词依存链扩展, VOB的修饰词>	若VOB修饰词的POS=a或b或i且核心词的POS=v
CMP	提取<CMP的核心词, CMP的修饰词依存链扩展, CMP的修饰词>	无

(注: a:形容词; b:修饰名词的词; j:缩写词; n:名词; v:动词。)

新窗口打开| 下载CSV

补充规则: 对于以上规则, 在对评价对象进行抽取时, 包含所有对应规则内的ATT关系, 对相应依存链边界进行补充; 在对评价短语进行抽取时, 包含所有对应规则内的ATT及ADV关系, 对相应依存链边界进行补充。

3.4 基于NodeRank算法的隐式标签抽取

在微博这类典型的用户自生成文本环境下, 用户的语言简练自由, 个性化更强, 并不是所有文本都会明确提及评价商品的某个部件或者属性, 如评论“偶尔有点卡顿, 很失望”, 文本中用户并没有提到有关产品的特征词, 但基于人们的日常使用经验, 不难发现“卡顿”描述的是“操作系统”这个特征。隐式特征提取的关键在于如何发现这些情感词和特征的特殊搭配关系。因此, 本文结合复杂网络的相关理论, 基于二分加权网络的NodeRank算法从网络拓扑结构分析的角度对产品特征词与情感词之间的“特殊性”进行排序, 并利用情感词对特征词进行映射, 从而更好地识别评论中的隐式特征。

基于已抽取的评价集, 从中抽取评价对象和评价核心词构建二分加权网络G(F,S), 以清晰直观地发现情感词与产品特征之间的关系, 如图4所示。网络图左侧的节点为评价单元中的评价对象, 右侧节点为评价单元中的评价核心词, 节点间的连线表示评价核心词与评价对象存在修饰关系, 连线上的数字权重表示评价核心词与评价对象在同一情感单元中出现的频次, 即评价核心词与评价对象在同一情感单元内出现, 两节点间产生连线, 出现的频次越高连线上的权重越大。

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 特征-情感词关系的二分网络示意图

NodeRank算法是基于PageRank算法引入连边权值的改进排序算法^[26], 该算法基于“指向网页的链接越多, 那么网页的重要性就越高”的思想, 在本文中, 如果某个形容词仅用来修饰少数几个特征词, 那么该特征词就越特殊, 其与特征词组成的搭配关系就越有可能是一个隐式特征关系对。NodeRank算法具体如公式(1)所示^[27]。

(1) $NR(s)=(1-d)+d\sum\limits_{i=1}^{i}{\frac{w({{f}_{i}}\cdot s)}{\sum\nolimits_{j=1}^{m}{w({{f}_{i}}\cdot {{f}_{j}})}}NR({{f}_{i}})}$

其中, d表示二分网络的基尼系数, $NR(s)$反映二分网络中情感词s的特殊程度, $w({{f}_{i}}\cdot s)$表示指向情感词s边连的权重, $\sum\nolimits_{j=1}^{m}{w({{f}_{i}}\cdot {{f}_{j}})}$表示特征词${{f}_{i}}$所有出边的权值。NR(s)的值越小, 表明其在二分网络中的特殊性越大。进而通过边连的权值选取所连接的权值最大的特征词作为该情感词的组合。

依据所选出的隐式表达关系联合WordSimilarity语义词典, 对缺少评价对象的三元组进行填补。优先使用本文发现的隐式表达关系集进行填补, 若不存在, 则利用WordSimilarity语义词典进行辅助填补。填补规则伪代码如下:

If三元组中不缺少评价对象

结束填补

Else

If隐式表达关系集中存在关于评价核心词的映射

使用本文发现的隐式表达关系集进行填补

Else

使用WordSimilarity语义词典, 按高相似系数优先的原

则对评价对象进行填补

Endif

4 实验分析

4.1 实验数据

选取日常生活中使用较为广泛的智能手表和手机作为实验对象, 通过Python编写网络爬虫程序, 以Apple Watch4、Mate20为关键词并对话题#Apple Watch 4#、# Apple Watch 4代#、#Mate 20#、#华为Mate 20#在新浪微博平台进行评论数据爬取, 爬取时间截至2019年3月18日, 共获取数据12 753条。由于平台的开放性, 原始评论数据中包含因用户转发而产生的重复数据以及商品宣传、促销活动等无关数据。因此, 编写Python程序进行数据去重, 对于重复数据只保留一条原始微博; 而宣传和促销类微博往往会包含一些特征词如“转发抽奖”、“集赞送”、“taobao.com”等, 通过关键词粗筛结合人工细筛的方式对无关数据进行清洗。最终获取微博语料1 417条, 其中智能手表评论674条, 手机评论743条, 形成待分析的智能手表评论数据集和手机评论数据集。

4.2 实验过程

根据本文定义的小句划分规则, 分别对两个数据集进行小句划分, 1 417条微博共被分为3 199个评价单元, 其中智能手表评论1 416个, 手机评论1 783个。通过Python调用哈尔滨工业大学语言云平台^①(①http://www.ltp-cloud.com/.)API, 依据提取规则对数据集进行显式标签抽取, 根据抽取结果是否缺少评价对象将其分为完整三元组和缺失三元组。

提取完整三元组中的<评价对象, 评价核心词>, 并利用NodeRank算法进行“特征-情感词”特殊性排序。设置d为默认参数0.85, NR值的阈值为排序总词数的前10%, NR值小于该阈值则认为该特征和情感词之间存在固定搭配关系并形成隐式表达关系集。隐式表达关系集中共纳入98个词对, 其中智能手表45个, 手机53个。部分搭配关系如表3所示。

表3 智能手表评论特征-情感词搭配特殊性排序(部分)

智能手表			手机
情感词	特征词	NR值	情感词	特征词	NR值
厚	表盘	0.0053	流畅	系统	0.0051
好看	外观	0.0053	耐用	电池	0.0051
划痕	屏幕	0.0056	漏光	屏幕	0.0051
瑕疵	手表	0.0056	刺眼	屏幕	0.0054
LOW	表带	0.0062	划痕	屏幕	0.0054
轻便	佩戴	0.0062	抗用	电池	0.0067
透气	表带	0.0062	噪音	通话	0.0067
柔软	表带	0.0068	卡顿	系统	0.0073
捂汗	表带	0.0068	黑点	屏幕	0.0073
炫酷	外观	0.0068	沾指纹	背壳	0.0085
掉皮	表带	0.0075	浴霸	摄像头	0.0085
漂亮	外观	0.0075	噪点	相机	0.0085
黑点	屏幕	0.0083	美轮美奂	颜色	0.0093
透汗	表带	0.0083	杠杠的	质量	0.0093
省电	电池	0.0088	贵	价格	0.0102
友好	系统	0.0088	酷	手机	0.0102
抗用	电池	0.0096	毛刺	中框	0.0115
时尚	外观	0.0096	掉漆	手机	0.0115
迟钝	系统	0.0112	清透	屏幕	0.0115

新窗口打开| 下载CSV

依据提取出的隐式特征关系联合WordSimilarity语义词典并依照填补规则, 进行缺失三元组填补, 形成最终的情感标签。

4.3 评价指标

使用准确率(P)、召回率(R)和F-Measure(F)以人工标注的情感标签作为标准, 对实验结果进行评估。人工标注的基本规则如下: 对于显式标签, 标注评论中的评价对象和评价短语; 对于隐式标签, 标注其中的

评价短语并人工对评价对象进行填补。标注过程由两名工作人员独立完成, 第三人对标注结果进行核实, 对于不一致的标注结果, 通过三人商议决定。评价指标的具体含义如下: 准确率指抽取结果中正确情感标签数与抽取出的情感标签总数的比值; 召回率是指抽取结果中正确情感标签数与实际存在的情感标签总数的比值; F-Measure是综合准确率和召回率的评价指标。准确率、召回率和F-Measure计算方法如公式(2)-公式(4)所示。

(2) $P=\frac{A}{A+B}$

(3) $R=\frac{A}{A+C}$

(4) $F=\frac{2PR}{P+R}$

其中, A表示抽取结果中正确的个数, B表示抽取结果中错误的个数, C表示遗漏个数。

4.4 情感标签抽取结果分析

本次情感标签抽取实验的统计结果如表4所示, 在召回率上, 两个数据集显式和隐式标签的抽取都高于85%, 表现良好。如对于内容相对密集的评论“不仅外观炫酷, 功能强大还非常省电”, 本文方法可以准确识别其中两个显式标签, 分别为<外观, 炫酷>和<功能, 强大>, 并对隐式表达“省电”进行了填补, 得到隐式标签<电池, 非常省电>。这与融入依存句法分析对小句进行改进划分有密切的关系, 准确的小句划分是精准、无遗漏地抽取评价对象的基础。在准确率上, 两个数据集显式标签抽取的准确率同样高于85%, 充分证明了本文提取规则的高覆盖率。对于隐式标签, 智能手表的抽取准确率为76.3%, 手机为76.5%, 低于显式特征提取的准确率86.9%和88.9%, 有待进一步提高。笔者通过对原始评论的回溯发现其与用户的少数“非特殊性”表达有关, 如“棒棒哒”这个情感词可以被用来描述多个特征, 而将这类通用情感词具体地划分到某一具体特征上时, 容易产生偏差。总体上, 与人工识别结果进行比对, 本文方法在总体准确率、召回率和F值上均有较好结果, 其中总体抽取结果的综合F值为85.3%, 抽取结果较为理想。

表4 抽取结果表

数据集		P	R	F值
智能手表	显式标签	86.9%	87.1%	87.0%
	隐式标签	76.3%	86.1%	80.9%
	总体	82.7%	86.7%	84.7%
手机	显式标签	88.9%	88.0%	88.4%
	隐式标签	76.5%	86.2%	81.1%
	总体	84.3%	87.4%	85.8%
SUM	显式标签	88.0%	87.6%	87.8%
	隐式标签	76.4%	86.1%	81.0%
	总体	83.6%	87.1%	85.3%

新窗口打开| 下载CSV

4.5 对比实验

为进一步验证本文的情感标签抽取方法, 笔者对近年的相关文献进行了筛选, 综合文献被引量以及面向的数据平台选取表现优异的方法——文献[22]作为对比对象, 该文献同样考虑了用户的隐式表达, 采用基于频繁项集和TF-IDF的方法对情感标签进行抽取。笔者使用相同数据集运用文献[22]中的方法进行情感标签抽取, 并以准确率、召回率和F值作为评价指标进行对比, 结果如表5所示。

表5 对比实验结果

	本文方法			文献[22]方法
	P	R	F值	P	R	F值
显式标签	88.0%	87.6%	87.8%	82.8%	82.4%	82.6%
隐式标签	76.4%	86.1%	81.0%	72.2%	81.3%	76.5%
总体	83.6%	87.1%	85.3%	78.7%	82.0%	80.3%

新窗口打开| 下载CSV

从总体F值可见, 本文抽取方法优于对比方法。同时, 从显式标签和隐式标签抽取的准确率和召回率来看, 本文方法也均高于对比方法。显式标签抽取的优越性证明了本文基于依存句法分析抽取方法的优势以及所设置抽取规则的高覆盖率和完整性。对比方法主要依靠频繁项集进行显式标签抽取的策略往往会遗漏一些较少被评论的产品特征且容易抽取一些无关信息, 如对评论“防水功能刚测试了一下, 很赞”, 本文抽取方法能直接抽取出评价对象(防水功能)和评论短语(很赞), 避免了“刚测试了一下”这些冗余信息的干扰, 使抽取结果更为精炼。隐式标签抽取的优越性与本文使用NodeRank算法从词间修饰关系和词频两个角度, 对全部产品特征进行综合隐式表达关系发现有着密切联系。对比方法利用TF-IDF对同一特征类的情感词进行计算, 然而, 对不同特征类分别进行表达关系的“特殊性”计算, 容易遗漏用户集中评论的产品特征下的表达关系。本文方法弥补了这一不足, 如对评论“就是有点捂汗”, 可以准确地还原 “捂汗”所修饰的特征词“表带”, 而对比方法未能对“捂汗”这一隐式表达的评价对象进行准确填补。

5 结语

本文面向微博商品评论, 针对特征级情感分析问题, 提出基于依存句法分析和NodeRank算法的情感标签抽取方法, 并通过实证与对比实验, 验证了本文方法的有效性。该方法提高了商品情感标签抽取的准确率, 为后续的情感极性分类工作提供了基础, 有一定的方法学意义, 还能实现综合显式和隐式的情感标签抽取, 使之可以更好地服务于厂家产品改进以及用户商品选购。

但是, 本文仍存在一定局限: 在隐式标签的抽取中未能充分考虑用户的“非特殊性”情感表达。未来笔者将对该类情感表达的隐式情感标签填补问题作进一步探索, 并针对情感标签进行情感极性分类, 以提高挖掘结果的现实意义。

作者贡献声明

李博诚: 设计研究方案, 进行实验, 起草并完善论文;

张云秋: 确定论文选题, 完善研究方案, 论文最终版本修订;

杨铠西: 数据采集和预处理, 数据分析。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: 1015436131@qq.com。

[1] 李博诚. 实验数据. rar. 本文实验及对比实验使用的评论数据.

[2] 李博诚. 实验代码. rar. 本文实验中涉及的程序代码.

[3] 李博诚. 对比实验代码. rar. 对比实验中涉及的程序代码.

[4] 李博诚. 实验抽取结果. xlsx. 本文方法的抽取结果.

[5] 李博诚. 对比实验抽取结果. xlsx. 对比方法的抽取结果.

[6] 李博诚. 隐式表达关系集. xlsx. 本文方法提取的隐式表达关系.

[7] 李博诚. 人工标注的情感标签. xlsx. 人工对情感标签进行的标注结果.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

( 中国互联网络信息中心.

第43次《中国互联网络发展状况统计报告》

[R/OL].(2019-02-28). [2019-03-02]. http://cnnic.cn/gywm/xwzx/rdxw/20172017_7056/201902/t20190228_70643.htm.

URL [本文引用: 1]

( (China Internet Information Center.

The 43rd China Internet Development Statistics Report

[R/OL].(2019-02-28). [2019-03-02]. http://cnnic.cn/gywm/xwzx/rdxw/20172017_7056/201902/t20190228_70643.htm. )

URL [本文引用: 1]

[2]

唐晓波, 王洪艳 .

微博产品评论挖掘模型研究

[J]. 情报杂志, 2013,32(2):107-111, 127.

检索词推荐：