Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (9): 74-82     https://doi.org/10.11925/infotech.2096-3467.2017.09.08
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于动态情感主题模型的在线评论分析*
李慧, 胡云凤()
西安电子科技大学经济与管理学院 西安 710071
Analyzing Online Reviews with Dynamic Sentiment Topic Model
Li Hui, Hu Yunfeng()
School of Economics and Management, Xidian University, Xi’an 710071, China
全文: PDF (1197 KB)   HTML ( 3
输出: BibTeX | EndNote (RIS)      
摘要 

目的】对在线评论进行分析, 揭示评论文本主题的内容和情感分布变化规律。【方法】使用融入先验信息的SSTM模型获得评论文档的情感分布, 以文档、文档情感分布和词项为可视变量, 提出DSTM模型, 并估算情感主题分布和主题词项分布。【结果】将采集的评论数据集按时间片划分进行建模, 实验得到主题的内容和情感随时间的变化趋势。【局限】未考虑不同主题之间的关联关系, 建模结果可能存在一定误差。【结论】融合时间外部特征的DSTM模型, 能够有效地对在线评论进行主题演化分析。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李慧
胡云凤
关键词 SSTMDSTM参数估计情感在线评论    
Abstract

[Objective] This paper analyzes online reviews to identify the patterns of their topic contents and sentiments. [Methods] First, we obtained the sentiment of the reviews with the SSTM model. Then, we proposed a DSTM model based on the document, document sentiment distribution and words. Finally, we estimated the distribution of sentiment-topic and the keywords. [Results] We modeled the review datasets by time slice and found the changing trends of contents and sentiments over time. [Limitations] The proposed model did not include the relationship among different subjects, which might generate errors. [Conclusions] The DSTM model, which integrates the external time features, can effectively analyze the evolution of online review topics.

Key wordsShort-text Sentiment-Topic Model    Dynamic Sentiment Topic Model    Parameter Estimation    Sentiment Online Reviews
收稿日期: 2017-04-07      出版日期: 2017-10-18
ZTFLH:  G350  
基金资助:*本文系国家自然科学青年基金项目“基于可信语义Wiki的知识库构建方法与应用研究”(项目编号: 71203173)和中央高校基本科研业务费专项资金资助项目“大数据环境下基于主题模型的信息服务研究”(项目编号: JB160606)的研究成果之一
引用本文:   
李慧, 胡云凤. 基于动态情感主题模型的在线评论分析*[J]. 数据分析与知识发现, 2017, 1(9): 74-82.
Li Hui,Hu Yunfeng. Analyzing Online Reviews with Dynamic Sentiment Topic Model. Data Analysis and Knowledge Discovery, 2017, 1(9): 74-82.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.09.08      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I9/74
  SSTM模型的图模型表示[7]
  DSTM模型的图模型表示
参数 具体含义
α 主题θ的先验狄利克雷参数
θ 情感s的主题分布
z 文档中词汇的主题
π 文档的情感分布
s 文档采样的某一情感
φ 主题的词分布
wi 文档中的第i个词汇
E 文档集的情感数量
D 文档子集中的文档数量
W 文档中的词汇数量
K 文档集的主题数量
  模型中的参数说明
  各个时间片上的评论数据分布
  不同主题数目上的情感判别精度
积极情感 消极情感
主题1 主题2 主题3 主题5 主题6
样子 系统 功能 发热 灵敏
手机 反应 软件 失灵 屏幕
操作 卸载
后盖 四核 配置 充电 触屏
顺手 齐全 不行 分辨率
做工 内存 通话 电池
速度 性价比 字体
漂亮 流畅 像素 充电器
配置 运行 信号 每天 失灵
电源键 性能 毫安
  第一个时间片的部分主题
  主题1在不同时间片上内容变化
  主题1在不同时间片上积极情感概率变化
  主题5在不同时间片上内容变化
  主题5在不同时间片上消极情感概率变化
  积极情感和消极情感评论数量比例
[1] Somprasertsri G, Lalitrojwong P.Mining Feature-Opinion in Online Customer Reviews for Opinion Summarization[J]. Journal of Universal Computer Science, 2010, 16(6): 938-955.
doi: 10.3217/jucs-016-06-0938
[2] Zhuang L, Jing F, Zhu X Y.Movie Review Mining and Summarization[C]// Proceedings of the 15th ACM International Conference on Information and Knowledge Management. ACM, 2006: 43-50.
[3] Hu M, Liu B.Mining and Summarizing Customer Reviews[C]// Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, Washington, USA. 2004: 168-177.
[4] Jo Y, Oh A H.Aspect and Sentiment Unification Model for Online Review Analysis[C]//Proceedings of the 4th ACM International Conference on Web Search and Data Mining. ACM, 2011: 815-824.
[5] Lin C, He Y, Everson R, et al.Weakly Supervised Joint Sentiment-topic Detection from Text[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(6): 1134-1145.
doi: 10.1109/TKDE.2011.48
[6] Blei D M, Ng A Y, Jordan M I.Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[7] 熊蜀峰, 姬东鸿. 面向产品评论分析的短文本情感主题模型[J]. 自动化学报, 2016, 42(8): 1227-1237.
doi: 10.16383/j.aas.2016.c150591
[7] (Xiong Shufeng, Ji Donghong.A Short Text Sentiment-topic Model for Product Review Analysis[J]. Acta Automatica Sinica, 2016, 42(8): 1227-1237.)
doi: 10.16383/j.aas.2016.c150591
[8] Blei D M, Lafferty J D.Dynamic Topic Models[C]// Proceedings of the 23rd International Conference on Machine Learning. 2006: 113-120.
[9] Griffiths T L, Steyversm M.Finding Scientific Topics[J]. Proceedings of the National Academy of Science of the United States of America, 2004, 101(S1): 5228-5235.
doi: 10.1073/pnas.0307752101
[10] Alsumaitl L, Barbará D, Domeniconic C.On-line LDA: Adaptive Topic Models for Mining Text Streams with Applications to Topic Detection and Tracking[C]// Proceedings of the 8th IEEE International Conference on Data Mining. 2008.
[11] Yan X, Guo J, Lan Y, et a1. A Biterm Topic Model for Short Texts[C]//Proceedings of the 22nd International Conference on World Wide Web. 2013.
[12] Andrzejewski D, Zhu X.Latent Dirichlet Allocation with Topic-in-Set Knowledge[C]// Proceedings of the NAACL HLT 2009 Workshop on Semi-Supervised Learning for Natural Language Processing.2009: 43-48.
[13] Xu H, Zhang F, Wang W.Implicit Feature Identification in Chinese Reviews Using Explicit Topic Mining Model[J]. Knowledge-Based Systems, 2015, 76: 166-175.
doi: 10.1016/j.knosys.2014.12.012
[14] 李实. 中文网络客户评论中的产品特征挖掘方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2009.
[14] (Li Shi.Research on the Approaches of Mining Product Features from Chinese Customer Reviews on the Internet [D]. Harbin: Harbin Institute of Technology, 2009.)
[15] 李超雄, 黄发良, 温肖谦, 等. 基于动态主题情感混合模型的微博主题情感演化分析方法[J]. 计算机应用, 2015, 35(10): 2905-2910.
doi: 10.11772/j.issn.1001-9081.2015.10.2905
[15] (Li Chaoxiong, Huang Faliang, Wen Xiaoqian, et al.Evolution Analysis Method of Microblog Topic-Sentiment Based on Dynamic Topic Sentiment Combining Model[J]. Journal of Computer Applications, 2015, 35(10): 2905-2910.)
doi: 10.11772/j.issn.1001-9081.2015.10.2905
[16] 徐戈, 王厚峰. 自然语言处理中主题模型的发展[J]. 计算机学报, 2011, 34(8): 1423-1436.
[16] (Xu Ge, Wang Houfeng.The Development of Topic Models in Natural Language Processing[J]. Chinese Journal of Computers, 2011, 34(8): 1423-1436.)
[1] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[2] 姜霖,张麒麟. 基于引文细粒度情感量化的学术评价研究*[J]. 数据分析与知识发现, 2020, 4(6): 129-138.
[3] 石磊,王毅,成颖,魏瑞斌. 自然语言处理中的注意力机制研究综述*[J]. 数据分析与知识发现, 2020, 4(5): 1-14.
[4] 叶光辉,曾杰妍,胡婧岚,毕崇武. 城市画像视角下的社会公众情感演化研究*[J]. 数据分析与知识发现, 2020, 4(4): 15-26.
[5] 李铁军,颜端武,杨雄飞. 基于情感加权关联规则的微博推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 27-33.
[6] 沈卓,李艳. 基于PreLM-FT细粒度情感分析的餐饮业用户评论挖掘[J]. 数据分析与知识发现, 2020, 4(4): 63-71.
[7] 薛福亮,刘丽芳. 一种基于CRF与ATAE-LSTM的细粒度情感分析方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[8] 谭荧,张进,夏立新. 社交媒体情境下的情感分析研究综述[J]. 数据分析与知识发现, 2020, 4(1): 1-11.
[9] 聂卉,何欢. 引入词向量的隐性特征识别研究*[J]. 数据分析与知识发现, 2020, 4(1): 99-110.
[10] 李博诚,张云秋,杨铠西. 面向微博商品评论的情感标签抽取研究 *[J]. 数据分析与知识发现, 2019, 3(9): 115-123.
[11] 岑咏华,谭志浩,吴承尧. 财经媒介信息对股票市场的影响研究: 基于情感分析的实证 *[J]. 数据分析与知识发现, 2019, 3(9): 98-114.
[12] 卢伟聪,徐健. 基于三分网络的网络用户评论情感分析 *[J]. 数据分析与知识发现, 2019, 3(8): 10-20.
[13] 李柯,佐々木勇和. 基于多维小波聚类的空间文本数据情感分布分析[J]. 数据分析与知识发现, 2019, 3(7): 14-22.
[14] 尤众喜,华薇娜,潘雪莲. 中文分词器对图书评论和情感词典匹配程度的影响 *[J]. 数据分析与知识发现, 2019, 3(7): 23-33.
[15] 张庆庆,贺兴时,王慧敏,蒙胜军. 基于深度信念网络的文本情感分类研究*[J]. 数据分析与知识发现, 2019, 3(4): 71-79.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn