Please wait a minute...
Advanced Search
数据分析与知识发现  2018, Vol. 2 Issue (8): 60-68     https://doi.org/10.11925/infotech.2096-3467.2017.1043
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*
何有世, 何述芳()
江苏大学管理学院 镇江 212013
Sentiment Mining of Online Product Reviews Based on Domain Ontology
He Youshi, He Shufang()
School of Management, Jiangsu University, Zhenjiang 212013, China
全文: PDF (589 KB)   HTML ( 2
输出: BibTeX | EndNote (RIS)      
摘要 

目的】研究产品各属性之间的层次关系以及消费者对产品局部属性与整体属性的情感态度, 优化情感分析结果。【方法】构建产品领域本体, 利用该本体提取产品属性并构建产品属性层次模型, 通过计算情感词与属性词搭配权重来识别隐式属性, 并构建领域情感词典, 计算各层次产品属性的情感倾向性, 从产品总体、属性类、单个属性三个层次, 实现产品细粒度的情感分析。【结果】采集手机在线评论数据设计实验, 对比实验结果表明本文算法在情感分类准确性上有明显提高。【局限】本文的产品属性的抽取与层次模型的构建依赖于所构建的领域本体, 因此本体构建的完善性还需进一步提高。【结论】本文方法能有效解决属性之间的逻辑关系, 进一步提高了情感分析的准确性与实践性。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
何有世
何述芳
关键词 领域本体产品属性多层次细粒度情感倾向    
Abstract

[Objective] This paper studies the relationship between the product attributes and the emotional attitudes of consumers, aiming to optimize the sentiment analysis on consumer reviews. [Methods] First, we constructed the product domain ontology to extract the needed attributes. Then, we built the product attribute hierarchy model, which combined the collocation weight of emotional words with attribute words to identify implicit attributes. Third, we created a dictionary to calculate the emotional orientation of product attributes at all levels for the sentiment analysis. [Results] We examined the proposed model with online reviews of smart phones and found it improved the accuracy of emotion classification. [Limitations] The construction of ontology needs to be further improved. [Conclusions] The proposed method could effectively identify the logical relationship among attributes, which improve the performance of sentiment analysis in real world cases.

Key wordsDomain Ontology    Product Feature    Multilevel    Fine-grained Emotional Orientation
收稿日期: 2017-10-20      出版日期: 2018-09-08
ZTFLH:  TP391  
基金资助:*本文系国家社会科学基金项目“基于领域本体的企业产品网络口碑危机预警研究”(项目编号: 16BGL088)的研究成果之一
引用本文:   
何有世, 何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
He Youshi,He Shufang. Sentiment Mining of Online Product Reviews Based on Domain Ontology. Data Analysis and Knowledge Discovery, 2018, 2(8): 60-68.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.1043      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2018/V2/I8/60
  基于领域本体的产品属性层次模型
正向情感评价词(+1) 负向情感评价词(-1)
清晰 赞 快 明显 有趣 多
耐用 舒服 酷 震撼 好
好玩 实惠 好用
模糊 慢 卡 漏光 简陋 差
发烫 死机 耗电 瑕疵 划痕
断流 跑电 缝隙
  手机静态情感词词典
正向情感评价词(+1) 负向情感评价词(-1)
配置高 科技含量重
清晰度高 性价比高
操作简单 功能强 耗电低
价格高 重量重 做工简单
功能简单噪音强 配置低
包装低
  手机动态情感词词典
情感强度值 程度副词
0.25 稍微 些许 略 略微 多少 有点 有些有点儿
0.75 较 较为 比较 不大 不太 不很
1.25 很 更 更加 更为 越 越发 备加 愈 愈加 愈发 越 格外 太 挺 忒 非常 特别 相当 十分 甚 颇 甚为 颇为 满 蛮 够 多么 真 特大 尤其
1.75 最 最为 极 极为 极其 极度 分外 要命
  程度副词词表
否定词(-1)
不、非、别、甭、不必、不曾、不要、没、没有、不用、
何必、何须、何曾、何尝、空、白、不是、徒、徒然、
无能、未、未曾、未尝、无需、毋庸、勿、否
  否定词词表
情感要素 处理规则
图片 若采用图片的形式来辅助评论文本的表达, 则对文本所表达属性的情感倾向进行调整, 将总的情感倾向乘以1.25倍
符号 ? 根据语义情况具体分析, 有可能语义不变, 有可能反向改变
“” 若情感词带有双引号, 则情感极性反向处理
若评论文本中带有感叹号, 则加重所表达的情感倾向, 加重程度与图片一致, 将总的情感倾向乘以1.25倍
  特殊情感要素调整词典
隐式句子 映射属性词 搭配权重
用着很流畅, 不愧是835的处理器 操作系统 (操作系统流畅, 0.832)
很清晰, 效果不错 屏幕 (屏幕清晰, 0.623)
有点小贵, 感觉不值 价格 (价格贵, 1)
买的4+64的, 看起来很漂亮 外观 (外观漂亮, 0.72)
还行, 应该是新机, 不卡 操作系统 (操作系统卡, 0.728)
  专用情感词—属性词
  属性情感层次化展示
实验方法 查准率 查全率 F值
本文方法 89.4% 86.9% 88.1%
产品属性类的方法 80.6% 76.1% 78.3%
  实验评估结果
[1] 潘宇, 林鸿飞. 基于语义极性分析的餐馆评论挖掘[J]. 计算机工程, 2008, 34(17): 208-210.
doi: 10.3969/j.issn.1000-3428.2008.17.074
[1] (Pan Yu, Lin Hongfei.Restaurant Reviews Mining Based on Semantic Polarity Analysis[J]. Computer Engineering, 2008, 34(17): 208-210.)
doi: 10.3969/j.issn.1000-3428.2008.17.074
[2] 尹裴, 王洪伟. 面向产品特征的中文在线评论情感分类: 以本体建模为方法[J]. 系统管理学报, 2016, 25(1): 103-114.
[2] (Yin Pei, Wang Hongwei.Sentiment Classification for Chinese Online Reviews at Product Feature Level Through Domain Ontology Method[J]. Journal of Systems and Management, 2016, 25(1): 103-114.)
[3] Yu H, Hatzivassiloglou V.Towards Answering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences[C]//Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. 2003: 129-136.
[4] Pang B, Lee L.Opinion Mining and Sentiment Analysis[J]. Foundations and Trends in Information Retrieval, 2008, 2(1-2): 1-135.
doi: 10.1561/1500000011
[5] Turney P D.Thumbs up or Thumbs down?: Semantic Orientation Applied to Unsupervised Classification of Reviews[C]//Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Stroudsburg, PA, USA: Association for Computational Linguistics, 2002: 417-424.
[6] He R, Gonzalez H.Numerical Synthesis of Pontryagin Optimal Control Minimizers Using Sampling-Based Methods[C]//Proceedings of the IEEE 56th Annual Conference on Decision and Control (CDC). Melbourne, Australia: IEEE CDC, 2017:733-738.
[7] Meena A, Prabhakar T V.Sentence Level Sentiment Analysis in the Presence of Conjuncts Using Linguistic Analysis[C]// Proceedings of the European Conference on Information Retrieval. 2007: 573-580.
[8] 张成功, 刘培玉, 朱振方, 等. 一种基于极性词典的情感分析方法[J]. 山东大学学报: 理学版, 2012, 47(3): 47-50.
[8] (Zhang Chenggong, Liu Peiyu, Zhu Zhenfang, et al.A Sentiment Analysis Method Based on a Polarity Lexion[J]. Journal of Shandong University: Natural Science, 2012, 47(3): 47-50.)
[9] Fu X, Liu G, Guo Y, et al.Multi-aspect Sentiment Analysis for Chinese Online Social Reviews Based on Topic Modeling and HowNet Lexicon[J]. Knowledge Based Systems, 2013, 37: 186-195.
doi: 10.1016/j.knosys.2012.08.003
[10] Kim S M, Hovy E. Extracting Opinions, Opinion Holders,Topics Expressed in Online News Media Text[C]// Proceedings of the Workshop on Sentiment & Subjectivity in Text at the International Conference on Computational Linguistics/the Annual Meeting of the Association for Computational Linguistics Sentiment and Subject. 2006: 101-108.
[11] Hai Z, Chang K, Kim J.Implicit Feature Identification via Co-occurrence Association Rule Mining[C]//Proceedings of the 12th International Conference on Intelligent Text Processing and Computational Linguistics. Berlin: Springer-Verlag, 2011: 393-404.
[12] 朱嫣岚, 闵锦, 周雅倩, 等. 基于HowNet的词汇语义倾向计算[J]. 中文信息学报, 2006, 20(1): 14-20.
doi: 10.3969/j.issn.1003-0077.2006.01.003
[12] (Zhu Yanlan, Min Jin, Zhou Yaqian, et al.Semantic Orientation Computing Based on HowNet[J]. Journal of Chinese Information Processing, 2006, 20(1): 14-20.)
doi: 10.3969/j.issn.1003-0077.2006.01.003
[13] Xu H, Zhang F, Wang W.Implicit Feature Identification in Chinese Reviews Using Explicit Topic Mining Model[J]. Knowledge Based Systems. 2015, 76: 166-175.
doi: 10.1016/j.knosys.2014.12.012
[14] Carenini G, Ng R T, Zwart E.Extracting Knowledge from Evaluative Text[C]//Proceedings of the 3rd International Conference on Knowledge Capture. Edmonton: ACM, 2005: 11-18.
[15] Yu J X, Zha Z J, Wang M, et al.Domain-Assisted Product Aspect Hierarchy Generation: Towards Hierarchical Organization of Unstructured Consumer Reviews[C]// Proceedings of 2011 Conference on Empirical Methods in Natural Language Processing. Edinburgh: ACL, 2011: 140-150.
[16] Yin P, Wang H, Guo K.Feature-Opinion Pair Identification of Product Reviews in Chinese: A Domain Ontology Modeling Method[J]. New Review of Hypermedia and Multimedia, 2013, 19(1): 3-24.
doi: 10.1080/13614568.2013.766266
[17] 唐晓波, 兰玉婷. 基于特征本体的微博产品评论情感分析[J]. 图书情报工作, 2016, 60(16): 121-127.
[17] (Tang Xiaobo, Lan Yuting.Sentiment Analysis of Microblog Product Reviews Based on Feature Ontology[J]. Library and Information Service, 2016, 60(16): 121-127.)
[18] 杜嘉忠, 徐健, 刘颖. 网络商品评论的特征-情感词本体构建与情感分析方法研究[J]. 现代图书情报技术, 2014(5): 74-82.
[18] (Du Jiazhong, Xu Jian, Liu Ying.Research on Construction of Feature-Sentiment Ontology and Sentiment Analysis[J]. New Technology of Library and Information Service, 2014(5): 74-82.)
[19] 李金海, 何有世, 马云蕾, 等. 基于在线评论信息挖掘的动态用户偏好模型构建[J]. 情报杂志, 2016, 35(9): 192-198.
[19] (Li Jinhai, He Youshi, Ma Yunlei, et al.Building Dynamic User Preference Model Based on Information Mining of Online Reviews[J]. Journal of Intelligence, 2016, 35(9): 192-198.)
[20] Gruber T R.Toward Principles for the Design of Ontologies Used for Knowledge Sharing[J]. International Journal of Human-Computer Studies, 1995, 43(5-6): 907-928.
doi: 10.1006/ijhc.1995.1081
[21] 董丽丽, 赵繁荣, 张翔. 基于领域本体、情感词典的商品评论倾向性分析[J]. 计算机应用与软件, 2014, 31(12): 104-108.
doi: 10.3969/j.issn.1000-386x.2014.12.024
[21] (Dong Lili, Zhao Fanrong, Zhang Xiang.Analysing Propensity of Product Reviews Based on Domain Ontology and Sentiment Lexicon[J]. Computer Applications and Software, 2014, 31(12): 104-108.)
doi: 10.3969/j.issn.1000-386x.2014.12.024
[22] 尹裴, 王洪伟, 郭恺强. 中文产品评论的“特征观点对”识别: 基于领域本体的建模方法[J]. 系统工程, 2013, 31(1): 68-77.
[22] (Yin Pei, Wang Hongwei, Guo Kaiqiang.Feature-Opinion Pair Identification in Chinese Online Reviews Based on Domain Ontology Modeling Method[J]. Systems Engineering, 2013, 31(1): 68-77.)
[23] Protégé [EB /OL]. [2010-12-12]..
[24] 宋园园, 余建坤. 一种基于领域知识的特征提取算法[J].云南民族大学学报: 自然科学版, 2017, 26(3): 252-257.
[24] (Song Yuanyuan, Yu Jiankun.A Feature Extraction Algorithm Based on Domain Knowledge[J]. Journal of Yunnan Minzu University: Natural Sciences Edition, 2017, 26(3): 252-257.)
[25] 杨燕霞. 基于本体的旅游网络评论情感分析与预警系统[J]. 计算机与数字工程, 2016, 44(4): 649-652.
doi: 10.3969/j.issn.1672-9722.2016.04.020
[25] (Yang Yanxia.Tourism Network Comments Sentiment Analysis and Pre-warning System Based on Ontology[J]. Computer and Digital Engineering, 2016, 44(4): 649-652.)
doi: 10.3969/j.issn.1672-9722.2016.04.020
[26] 张莉, 许鑫. 产品评论中的隐式属性抽取研究[J]. 现代图书情报技术, 2015(12): 42-47.
[26] (Zhang Li, Xu Xin.Implicit Feature Identification in Product Reviews[J]. New Technology of Library and Information Service, 2015(12): 42-47.)
[27] 赵志滨, 刘欢, 姚兰, 等. 中文产品评论的维度挖掘及情感分析技术研究[J]. 计算机科学与探索, 2018, 12(3): 341-349.
[27] (Zhao Zhibin, Liu Huan, Yao Lan, et al.Research on Dimension Mining and Sentiment Analysis for Chinese Product Comments[J]. Journal of Frontiers of Computer Science and Technology, 2018, 12(3): 341-349.)
[1] 伍杰华,沈静,周蓓. 基于迁移成分分析的多层社交网络链接分类*[J]. 数据分析与知识发现, 2018, 2(9): 88-99.
[2] 陆佳莹,袁勤俭,黄奇,钱韵洁. 基于概念格理论的产品领域本体构建研究*[J]. 现代图书情报技术, 2016, 32(5): 38-46.
[3] 鲍玉来,毕强. 蒙古文音乐领域的语义检索初探*[J]. 现代图书情报技术, 2016, 32(11): 94-100.
[4] 张帆, 乐小虬. 领域科技文献创新点句中主题属性实例识别方法研究[J]. 现代图书情报技术, 2015, 31(5): 15-23.
[5] 段宇锋, 朱雯晶, 陈巧, 刘伟, 刘凤红. 条件随机场与领域本体元素集相结合的未登录词识别研究[J]. 现代图书情报技术, 2015, 31(4): 41-49.
[6] 段宇锋, 黄思思. 基于BFO构建中文植物物种多样性领域本体的研究[J]. 现代图书情报技术, 2015, 31(12): 72-79.
[7] 颜时彦, 王胜清, 罗云川, 黄浩军. 云环境下基于FCA的领域本体协作构建模式初探[J]. 现代图书情报技术, 2014, 30(3): 49-56.
[8] 姚晓娜, 祝忠明, 王思丽. 面向地学领域的自动语义标注研究[J]. 现代图书情报技术, 2013, (4): 48-53.
[9] 许鑫, 郭金龙. 基于领域本体的专题库构建——以中华烹饪文化知识库为例[J]. 现代图书情报技术, 2013, (12): 2-9.
[10] 郭金龙, 洪韵佳, 许鑫. 中华烹饪文化领域本体构建及其应用[J]. 现代图书情报技术, 2013, (12): 10-18.
[11] 洪韵佳, 许鑫. 基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例[J]. 现代图书情报技术, 2013, (12): 19-26.
[12] 金碧漪, 郭金龙, 许鑫. 利用领域本体优化文档检索的研究——基于KIM平台的设计与实现[J]. 现代图书情报技术, 2013, (12): 27-33.
[13] 唐晓波, 肖璐. 融合关键词增补与领域本体的共词分析方法研究[J]. 现代图书情报技术, 2013, 29(11): 60-67.
[14] 李树青, 刘晓倩. 基于向心扩散加权XML模型的异构用户个性化模式匹配方法[J]. 现代图书情报技术, 2012, 28(5): 32-40.
[15] 毕强, 鲍玉来. 基于领域本体和RSS的OA资源集成门户设计与实现[J]. 现代图书情报技术, 2012, 28(3): 78-82.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn