Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (10): 24-28     https://doi.org/10.11925/infotech.1003-3513.2011.10.05
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
网络情感词自动识别方法研究
张清亮, 徐健
中山大学资讯管理学院 广州 510006
Research on Automatic Extraction of Web Sentiment Words
Zhang Qingliang, Xu Jian
School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China
全文: PDF (476 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 针对情感词识别及情感词库构建效率不高的问题,提出一种自动提取基准情感词集的方法,从词频、词的领域性情感倾向和词的情感强度三方面进行基准词筛选,再凭借目标词与正、负基准词集的不同语义相似度进行情感词的识别和情感倾向的判断,使机器能够自动完成大部分工作,提高效率,降低构建不同领域情感词库的成本。以京东商城71 061条评论和卓越网1 736条评论为数据集进行实验,获得的召回率为76.36%,准确率为76.94%,情感倾向判断的准确率为62.70%。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 情感分析情感倾向PMI-IR情感词库    
Abstract:To improve the efficiency of extracting sentiment words and building sentiment lexicon, the authors propose a method to extract a set of basic sentiment words, and then to calculate both the PMI-IR value between candidate word and the positive basic sentiment word set and the PMI-IR value between candidate words and the negative basic sentiment word set, to judge the orientation of a candidate word.Taking account of frequency, orientation, intensity and definiteness of words, computers are able to finish most of the work. It improves the efficiency and reduces cost of building sentiment lexicon. Experiment is processed on the dataset constituted with 71 061 reviews from 360buy and 1 736 reviews from Joyo. With the dataset, the method achieves a recall rate of 76.36%, a precision of 76.94%,and the precision of sentiment orientation is 62.70%.
Key wordsSentiment analysis    Sentiment orientation    PMI-IR    Sentiment lexicon
收稿日期: 2011-07-28      出版日期: 2011-12-03
: 

G250

 
基金资助:

本文系国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”(项目编号:11CTQ022)的研究成果之一。

引用本文:   
张清亮, 徐健. 网络情感词自动识别方法研究[J]. 现代图书情报技术, 2011, 27(10): 24-28.
Zhang Qingliang, Xu Jian. Research on Automatic Extraction of Web Sentiment Words. New Technology of Library and Information Service, 2011, 27(10): 24-28.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.10.05      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I10/24
[1] Turney P D, Littman M L. Measuring Praise and Critism: Inference of Semantic Orientation from Association[J]. ACM Tanslations on Information Systems,2003,21(4):315-346.

[2] 王素格. 基于Web的评论文本情感分类问题研究 .上海:上海大学, 2008.

[3] Tian P, Liu Y, Liu M. Research of Product Ranking Technology Based on Opinion Mining .In:Proceedings of the 2nd International Conference on Intelligent Computation Technology and Automation.2009:239-243.

[4] 董振东,董强. 知网 . .http://www.keenage.com/.

[5] Kamps J, Marx M, Mokken R J. Words with Attitude . In:Proceedings of the 1st International Conference on Global WordNet.2002:332-341.

[6] 朱嫣岚,闵锦,周雅倩,等. 基于HowNet的词汇语义倾向计算[J]. 中文信息学报, 2006,20(1):14-20.

[7] 路斌,万小军,杨建武.基于同义词词林的词汇褒贬计算 . 见: 中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集 . 中国,武汉:中国中文信息学会, 2007.

[8] Dave K, Lawrence S, Pennock D M. Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews . In:Proceedings of the 12th International Conference on World Wide Web.2003: 519-528.

[9] 彭学仕,孙春华.面向倾向性分析的基于词聚类的基准词选择方法[J]. 计算机应用研究, 2011,28(1):114-116.

[10] 王素格,李德玉,魏英杰,等. 基于同义词的词汇情感倾向判别方法[J]. 中文信息学报, 2009,23(5): 68-74.

[11] Turney P D. Mining the Web for Synonyms: PMI-IR Versus LSA on TOEFL .In:Proceedings of the 12th European Conference on Machine Learning, Freiburg, Germany.2001:491-502.

[12] 亚马逊公司.卓越网.http://www.amazon.cn/.

[13] 北京当当网信息技术有限公司.当当网.http://www.dangdang.com/.

[14] 北京京东世纪商贸有限公司.京东商城.http://www.360buy.com/.

[15] 阿里巴巴集团.淘宝网.http://www.taobao.com/.

[16] Abulaish M, Jahiruddin, Doja M N, et al. Feature and Opinion Mining for Customer Review Summarization . In:Proceeding of the 3rd International Conference on Pattern Recognition and Machine Intelligence. 2009:219-224.

[17] Hu M, Liu B. Mining Opinion Features in Customer Reviews . In:Proceedings of the 19th National Conference on Artificial Intelligence. 2004:755-760.
[1] 徐月梅, 王子厚, 吴子歆. 一种基于CNN-BiLSTM多特征融合的股票走势预测模型*[J]. 数据分析与知识发现, 2021, 5(7): 126-138.
[2] 钟佳娃,刘巍,王思丽,杨恒. 文本情感分析方法及应用综述*[J]. 数据分析与知识发现, 2021, 5(6): 1-13.
[3] 刘彤,刘琛,倪维健. 多层次数据增强的半监督中文情感分析方法*[J]. 数据分析与知识发现, 2021, 5(5): 51-58.
[4] 王雨竹,谢珺,陈波,续欣莹. 基于跨模态上下文感知注意力的多模态情感分析 *[J]. 数据分析与知识发现, 2021, 5(4): 49-59.
[5] 常城扬,王晓东,张胜磊. 基于深度学习方法对特定群体推特的动态政治情感极性分析*[J]. 数据分析与知识发现, 2021, 5(3): 121-131.
[6] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[7] 韩普, 张伟, 张展鹏, 王宇欣, 方浩宇. 基于特征融合和多通道的突发公共卫生事件微博情感分析*[J]. 数据分析与知识发现, 2021, 5(11): 68-79.
[8] 吕华揆,刘政昊,钱宇星,洪旭东. 异质性财经新闻与股市关系研究*[J]. 数据分析与知识发现, 2021, 5(1): 99-111.
[9] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[10] 姜霖,张麒麟. 基于引文细粒度情感量化的学术评价研究*[J]. 数据分析与知识发现, 2020, 4(6): 129-138.
[11] 石磊,王毅,成颖,魏瑞斌. 自然语言处理中的注意力机制研究综述*[J]. 数据分析与知识发现, 2020, 4(5): 1-14.
[12] 李铁军,颜端武,杨雄飞. 基于情感加权关联规则的微博推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 27-33.
[13] 沈卓,李艳. 基于PreLM-FT细粒度情感分析的餐饮业用户评论挖掘[J]. 数据分析与知识发现, 2020, 4(4): 63-71.
[14] 薛福亮,刘丽芳. 一种基于CRF与ATAE-LSTM的细粒度情感分析方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[15] 张翼鹏,马敬东. 突发公共卫生事件误导信息受众情感分析及传播特征研究*[J]. 数据分析与知识发现, 2020, 4(12): 45-54.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn