Please wait a minute...
Advanced Search
现代图书情报技术  2014, Vol. 30 Issue (4): 58-64     https://doi.org/10.11925/infotech.1003-3513.2014.04.09
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
面向情感分析的用户评论过滤模型研究
蔡晓珍1, 徐健1, 吴思竹2
1. 中山大学资讯管理学院 广州 510006;
2. 中国医学科学院医学信息研究所 北京 100020
Research on Filter Model of Customer Review for Sentiment Analysis
Cai Xiaozhen1, Xu Jian1, Wu Sizhu2
1. School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China;
2. Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020, China
全文: PDF (666 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的] 针对情感分析研究中网络用户评论质量良莠不一的问题,构建过滤模型进行筛选。[方法] 选取涉及产品词汇量、评论长度、情感强度、修饰词数量4个指标作为评判依据,利用多元线性回归方法和来自购物网站的数据构建模型。[结果] 发现涉及产品词汇量、评论长度、情感强度、修饰词数量与评论质量存在相关性。所构建的过滤模型具有较高的召回率和准确率,为情感分析中数据源的筛选提供一种新方法。[局限] 存在数据稀缺性影响,所构建的模型具有局限性。[结论] 在误差允许的范围内,该模型能够对评论的质量等级进行自动判断。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
蔡晓珍
吴思竹
徐健
关键词 评论过滤用户评论情感分析    
Abstract

[Objective] Aiming at the problem of quality testing in the process of sentiment analysis research, the paper constructs a filter model to select more suitable review. [Methods] It selects four indexes namely product words, length of review, emotional strength and adjunct words as judgment references, using multiple linear regression method and data from shopping website to construct the model. [Results] The four indexes are related to the quality of review, and the filter model gains high accuracy in terms of recall rate and precision so that it provides a new method for selection of data source in the sentiment analysis research. [Limitations] Data scarcityleads to the limitation ofthe filter model. [Conclusions] The model can judge the quality of customer reviews in the range of permitted errors.

Key wordsReview filtration    Customer review    Sentiment analysis
收稿日期: 2013-12-24      出版日期: 2014-05-19
:  G353.1  
基金资助:

本文系国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”(项目编号:11CTQ022)的研究成果之一。

通讯作者: 徐健 E-mail:issxj@mail.sysu.edu.cn     E-mail: issxj@mail.sysu.edu.cn
作者简介: 作者贡献声明:徐健:提出研究思路,设计研究方案; 蔡晓珍:进行实验; 蔡晓珍,吴思竹:采集、清洗和分析数据; 蔡晓珍,徐健:论文起草;徐健:论文最终版本修订。
引用本文:   
蔡晓珍, 徐健, 吴思竹. 面向情感分析的用户评论过滤模型研究[J]. 现代图书情报技术, 2014, 30(4): 58-64.
Cai Xiaozhen, Xu Jian, Wu Sizhu. Research on Filter Model of Customer Review for Sentiment Analysis. New Technology of Library and Information Service, 2014, 30(4): 58-64.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2014.04.09      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2014/V30/I4/58

[1] Liu Y,Huang X J.Modeling and Predicting the Helpfulness of Online Reviews[C].In:Proceedings of the 8th IEEE International Conference on Data Mining.2008:443-452.
[2] 郝媛媛,叶强,李一军.基于影评数据的在线评论有用性影响因素研究[J].管理科学学报,2010,13(8):78-88,96.(Hao Yuanyuan,Ye Qiang,Li Yijun.Research on Online Impact Factors of Customer Review Usefulness Based on Movie Reviews Data[J].Journal of Management Sciences in China,2010,13(8):78-88,96.)
[3] Mudambi S M,Schuff D.What Makes a Helpful Online Review? A Study of Customer Reviews on Amazon.com[J].MIS Quarterly,2010,34 (1):185-200.
[4] Chen C C,Tseng Y D.Quality Evaluation of Product Reviews Using an Information Quality Framework[J].Decision Support Systems,2011,50(4) :755-768.
[5] 孙升芸,田萱.产品垃圾评论检测研究综述[J].计算机科学,2011,38(10A):198-201.(Sun Shengyun,Tian Xuan.Survey on Product Review Spam Detection[J].Computer Science,2011,38(10A):198-201.)
[6] 刘送英.在线顾客评论有用性研究[D].厦门:华侨大学,2011.(Liu Songying.Survey on the Usefulness of Online Customer Reviews[D].Xiamen :HuaQiao University,2011.)
[7] 苏雪佳.B2C在线评论有用性影响因素研究——以亚马逊网站为例[D].武汉:中南民族大学,2012.(Su Xuejia.A Study of the Impact Factors of the Helpfulness of B2C Online Reviews —— A Case Study of Amazon[D].Wuhan:South- Central University for Nationalities,2012.)
[8] 姜巍,张莉,戴翼,等.面向用户需求获取的在线评论有用性分析[J].计算机学报,2013,36(1):119-130.(Jiang Wei,Zhang Li,Dai Yi,et al.Analyzing Helpfulness of Online Reviews for Users Requirements Elicitation[J] .Chinese Journal of Computers,2013,36 (1) :119-130.)
[9] 朱玉洁.商业银行在线评论的影响研究[J].商品与质量,2011(S):177-178.(Zhu Yujie .Survey on the Impact of Online Reviews of Business Bank[J].Goods and Quality,2011(S):177-178.)
[10] Amazon[EB/OL].[2013-09-09].http://www.amazon.cn/.
[11] 京东商城[EB/OL].[2014-01-03].http://www.jd.com/.(JD Online Shopping Mall[EB/OL].[2014-01-03].http://www.jd.com/.)
[12] Wikipedia.SPSS[EB/OL].[2013-10-08].http://zh.wikipedia.org/wiki/SPSS.
[13] Wikipedia.Spearman's Rank Correlation Coefficient[EB/OL].[2013-10-08].http://en.wikipedia.org/wiki/Spearman%27s_ rank_correlation_coefficient.
[14] Wikipedia.文本信息检索[EB/OL].[2014-01-21].http://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E4%BF%A1%E6%81%AF%E6%A3%80%E7%B4%A2.(Wikipedia.Docu­ment retrieval[EB/OL].[2014-01-21].http://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E4%BF%A1%E6%81%AF%E6%A3%80%E7%B4%A2.)

[1] 钟佳娃,刘巍,王思丽,杨恒. 文本情感分析方法及应用综述*[J]. 数据分析与知识发现, 2021, 5(6): 1-13.
[2] 刘彤,刘琛,倪维健. 多层次数据增强的半监督中文情感分析方法*[J]. 数据分析与知识发现, 2021, 5(5): 51-58.
[3] 王雨竹,谢珺,陈波,续欣莹. 基于跨模态上下文感知注意力的多模态情感分析 *[J]. 数据分析与知识发现, 2021, 5(4): 49-59.
[4] 常城扬,王晓东,张胜磊. 基于深度学习方法对特定群体推特的动态政治情感极性分析*[J]. 数据分析与知识发现, 2021, 5(3): 121-131.
[5] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[6] 韩普, 张伟, 张展鹏, 王宇欣, 方浩宇. 基于特征融合和多通道的突发公共卫生事件微博情感分析*[J]. 数据分析与知识发现, 2021, 5(11): 68-79.
[7] 吕华揆,刘政昊,钱宇星,洪旭东. 异质性财经新闻与股市关系研究*[J]. 数据分析与知识发现, 2021, 5(1): 99-111.
[8] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[9] 姜霖,张麒麟. 基于引文细粒度情感量化的学术评价研究*[J]. 数据分析与知识发现, 2020, 4(6): 129-138.
[10] 石磊,王毅,成颖,魏瑞斌. 自然语言处理中的注意力机制研究综述*[J]. 数据分析与知识发现, 2020, 4(5): 1-14.
[11] 李铁军,颜端武,杨雄飞. 基于情感加权关联规则的微博推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 27-33.
[12] 沈卓,李艳. 基于PreLM-FT细粒度情感分析的餐饮业用户评论挖掘[J]. 数据分析与知识发现, 2020, 4(4): 63-71.
[13] 薛福亮,刘丽芳. 一种基于CRF与ATAE-LSTM的细粒度情感分析方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[14] 张翼鹏,马敬东. 突发公共卫生事件误导信息受众情感分析及传播特征研究*[J]. 数据分析与知识发现, 2020, 4(12): 45-54.
[15] 谭荧,张进,夏立新. 社交媒体情境下的情感分析研究综述[J]. 数据分析与知识发现, 2020, 4(1): 1-11.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn