Please wait a minute...
Advanced Search
现代图书情报技术  2014, Vol. 30 Issue (5): 74-82    DOI: 10.11925/infotech.1003-3513.2014.05.10
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
网络商品评论的特征-情感词本体构建与情感分析方法研究*
杜嘉忠1, 徐健1, 刘颖2
1 中山大学资讯管理学院 广州 510006;
2 中山大学图书馆 广州 510275
Research on Construction of Feature-Sentiment Ontology and Sentiment Analysis
Du Jiazhong1, Xu Jian1, Liu Ying2
1 School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China;
2 Sun Yat-Sen University Libraries, Guangzhou 510275, China
全文: PDF(1227 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】解决情感分析领域使用通用情感词典进行情感分析时, 在特定领域内无法识别领域专用情感词, 以及同一情感词描述不同特征时可能表达出不同情感倾向的两个问题。【方法】提出一种基于领域专用情感词的网络评论情感分析方法。该方法构建特征-情感词本体, 利用本体对网络上的产品评论进行情感分析。并与基于Senti-HowNet词典的情感分析方法进行对比。【结果】本文方法在特征层的情感倾向分析的准确率和召回率都有显著提高。【局限】本文方法中的本体需要尽可能完整的特征词集和情感词集, 并且情感分析结果好坏直接依赖于本体的构建是否完善; 由于网络文本的不规范性, 特征词和情感词抽取以及情感分析的过程都不考虑句法结构; 数据分析过程对问题进行了简化, 仅考虑特征粒度的情感倾向, 未考虑连词等对情感倾向有影响的其他因素。【结论】对专用情感词和通用情感词进行分类管理, 解决了两个问题, 情感分析结果得到提高。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘颖
杜嘉忠
徐健
关键词 情感分析专用情感词本体网络评论    
Abstract

[Objective] In a specific domain, sentiment analysis, mostly based on general lexicon, cannot identify the context-specific sentiment belonging to the domain. Also, the same word in the specific domain shows different polarities (positive, negative, neutral) when describing different properties. The objective of this paper is to solve the problems described above. [Methods] A sentiment analysis approach based on domain-oriented specific sentiment phrases is proposed. By developing feature-sentiment Ontology, general sentiment and specific sentiment can be divided during the process of sentiment analysis. [Results] The proposed method shows fairly better results of precision and recall in terms of phrase-level sentiment analysis. [Limitations] In order to get better analysis, the Ontology should cover the concepts in the related field as much as possible and should be well-built; the authors ignore the syntactic rules during the concept extraction and sentiment analysis, because the product comments are not normative; in the phase of sentiment analysis, the authors assume that the context like conjunction would not affect the polarity. [Conclusions] The new method not only makes improvement on sentiment analysis by solving the problem described above, but also proposes a new way for sentiment lexicon management.

Key wordsSentiment analysis    Domain sentiment phrase    Ontology    Online review
收稿日期: 2013-12-31     
:  G250  
基金资助:

*本文系国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”(项目编号: 11CTQ022)的研究成果之一

通讯作者: 徐健 E-mail:issxj@mail.sysu.edu.cn   
作者简介: [1]徐健: 提出研究思路, 设计研究方法; [2]徐健, 杜嘉忠, 刘颖: 文献调研, 收集和研究; 杜嘉忠, 刘颖: 选定研究数据, 对数据进行收集和清洗; 杜嘉忠: 研究过程实施, 原型系统开发, 数据分析, 论文起草和修改; 徐健, 刘颖: 论文审阅、定稿和最终版本修订。
引用本文:   
杜嘉忠, 徐健, 刘颖. 网络商品评论的特征-情感词本体构建与情感分析方法研究*[J]. 现代图书情报技术, 2014, 30(5): 74-82.
Du Jiazhong, Xu Jian, Liu Ying. Research on Construction of Feature-Sentiment Ontology and Sentiment Analysis. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2014.05.10.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2014.05.10

[1] Pang B, Lee L. Opinion Mining and Sentiment Analysis [J]. Foundations and Trends in Information Retrieval, 2008, 2(1-2): 1-135.
[2] Tong R M. An Operational System for Detecting and Tracking Opinions in Online Discussion[C]. In: Working Notes of the ACM SIGIR 2001 Workshop on Operational Text Classification. New York: ACM, 2001: 1-6.
[3] Kim S M, Hovy E. Determining the Sentiment of Opinions[C]. In: Proceedings of the 20th International Conference on Computational Linguistics. Stroudsburg, PA, USA: Association for Computational Linguistics, 2004.
[4] 张成功, 刘培玉, 朱振方, 等. 一种基于极性词典的情感分析方法[J].山东大学学报:理学版, 2012, 47(3): 47-50.(Zhang Chenggong, Liu Peiyu, Zhu Zhenfang, et al. A Sentiment Analysis Method Based on a Polarity Lexion[J]. Journal of Shandong University: Natural Science, 2012, 47(3): 47-50.)
[5] Zhou L, Chaovalit P. Ontology‐Supported Polarity Mining [J]. Journal of the American Society for Information Science and Technology, 2008, 59(1): 98-110.
[6] Peñalver-Martínez I, Valencia-García R, García-Sánchez F. Ontology-Guided Approach to Feature-Based Opinion Mining [C]. In: Proceedings of the 16th International Conference on Natural Language Processing and Information Systems. Berlin, Heidelberg: Springer -Verlag, 2011: 193-200.
[7] Yin P, Wang H, Guo K. Feature-opinion Pair Identification of Product Reviews in Chinese: A Domain Ontology Modeling Method [J]. New Review of Hypermedia and Multimedia. 2013, 19(1): 3-24.
[8] 李耀林. 面向评价对象的商品评论情感倾向性分析研究[D]. 杭州: 浙江工商大学, 2013. (Li Yaolin. Research on Sentiment Orientation Analysis of Product Comment in Evaluation Objects[D]. Hangzhou: Zhejiang Gongshang University, 2013.)
[9] 黄亿华. 基于情感评价单元的商品评论分析研究[D]. 南京: 南京大学, 2011. (Huang Yihua. Research on Product Reviews Analysis Based on Appraisal Expression [D]. Nanjing: Nanjing University, 2011.)
[10] 张清亮, 徐健. 网络情感词自动识别方法研究[J]. 现代图书情报技术, 2011(10): 24-28. (Zhang Qingliang, Xu Jian. Research on Automatic Extraction of Web Sentiment Words[J]. New Technology of Library and Information Service, 2011(10): 24-28.)
[11] Hu M, Liu B. Mining and Summarizing Customer Reviews[C]. In: Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2004: 168-177.
[12] Salton G, McGill M J. Introduction to Modern Information Retrieval [M]. New York, NY, USA: McGraw-Hill Inc.,1986.
[13] Turney P. Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL [C]. In:Proceeding of the 12th European Conference on Machine Learning (ECML-2001). London: Springer, 2001: 491-502.
[14] Amazon.cn [DB/OL]. [2013-06-20]. http://www. amazon.cn/.
[15] Zhang H P, Yu H K, Xiong D Y, et al. HHMM-based Chinese Lexical Analyzer ICTCLAS[C]. In: Proceedings of the 2nd SIGHAN Workshop on Chinese Language Processing-Volume 17. Stroudsburg, PA, USA: Association for Computational Lin-guistics, 2003: 184-187.
[16] HowNet[DB/OL]. [2013-06-20]. http://www.keenage.com.
[17] Knublauch H, Fergerson R W, Noy N F, et al. The Protégé OWL Plugin: An Open Development Environment for Semantic Web Applications [C]. In: Proceedings of the Semantic Web-ISWC 2004. Berlin, Heidelberg: Springer, 2004: 229-243.
[18] Zhuang L, Jing F, Zhu X Y. Movie Review Mining and Summarization [C]. In: Proceedings of the 15th ACM International Conference on Information and Knowledge Management. New York:ACM, 2006: 43-50.
[19] Shi B, Chang K. Mining Chinese Reviews[C]. In: Proceedings of the 6th IEEE International Conference on Data Ming, Hong Kong, China. IEEE, 2006: 585-589.

[1] 尤众喜,华薇娜,潘雪莲. 中文分词器对图书评论和情感词典匹配程度的影响 *[J]. 数据分析与知识发现, 2019, 3(7): 23-33.
[2] 邓诗琦,洪亮. 面向智能应用的领域本体构建研究*——以反电话诈骗领域为例[J]. 数据分析与知识发现, 2019, 3(7): 73-84.
[3] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[4] 蒋翠清,郭轶博,刘尧. 基于中文社交媒体文本的领域情感词典构建方法研究*[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[5] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[6] 余本功,张培行,许庆堂. 基于F-BiGRU情感分析的产品选择方法*[J]. 数据分析与知识发现, 2018, 2(9): 22-30.
[7] 曾子明,杨倩雯. 基于LDA和AdaBoost多特征组合的微博情感分析*[J]. 数据分析与知识发现, 2018, 2(8): 51-59.
[8] 何有世,何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[9] 唐慧慧,王昊,张紫玄,王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[10] 王秀芳,盛姝,路燕. 一种基于话题聚类及情感强度的微博舆情分析模型*[J]. 数据分析与知识发现, 2018, 2(6): 37-47.
[11] 庞贝贝,苟娟琼,穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[12] 杨斯楠,徐健,叶萍萍. 网络评论情感可视化技术方法及工具研究*[J]. 数据分析与知识发现, 2018, 2(5): 77-87.
[13] 王婷婷,王凯平,戚桂杰. 基于情感分析的开放式创新平台创意采纳研究: 以Salesforce为例*[J]. 数据分析与知识发现, 2018, 2(4): 38-47.
[14] 丁晟春,刘梦露,傅柱. 概念设计中基于知识流的多维设计知识统一建模技术研究*[J]. 数据分析与知识发现, 2018, 2(2): 11-19.
[15] 赵杨,李齐齐,陈雨涵,曹文航. 基于在线评论情感分析的海淘APP用户满意度研究*[J]. 数据分析与知识发现, 2018, 2(11): 19-27.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn