Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (9): 74-82     https://doi.org/10.11925/infotech.2096-3467.2017.09.08
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于动态情感主题模型的在线评论分析*
李慧, 胡云凤()
西安电子科技大学经济与管理学院 西安 710071
Analyzing Online Reviews with Dynamic Sentiment Topic Model
Li Hui, Hu Yunfeng()
School of Economics and Management, Xidian University, Xi’an 710071, China
全文: PDF (1197 KB)   HTML ( 7
输出: BibTeX | EndNote (RIS)      
摘要 

目的】对在线评论进行分析, 揭示评论文本主题的内容和情感分布变化规律。【方法】使用融入先验信息的SSTM模型获得评论文档的情感分布, 以文档、文档情感分布和词项为可视变量, 提出DSTM模型, 并估算情感主题分布和主题词项分布。【结果】将采集的评论数据集按时间片划分进行建模, 实验得到主题的内容和情感随时间的变化趋势。【局限】未考虑不同主题之间的关联关系, 建模结果可能存在一定误差。【结论】融合时间外部特征的DSTM模型, 能够有效地对在线评论进行主题演化分析。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李慧
胡云凤
关键词 SSTMDSTM参数估计情感在线评论    
Abstract

[Objective] This paper analyzes online reviews to identify the patterns of their topic contents and sentiments. [Methods] First, we obtained the sentiment of the reviews with the SSTM model. Then, we proposed a DSTM model based on the document, document sentiment distribution and words. Finally, we estimated the distribution of sentiment-topic and the keywords. [Results] We modeled the review datasets by time slice and found the changing trends of contents and sentiments over time. [Limitations] The proposed model did not include the relationship among different subjects, which might generate errors. [Conclusions] The DSTM model, which integrates the external time features, can effectively analyze the evolution of online review topics.

Key wordsShort-text Sentiment-Topic Model    Dynamic Sentiment Topic Model    Parameter Estimation    Sentiment Online Reviews
收稿日期: 2017-04-07      出版日期: 2017-10-18
ZTFLH:  G350  
基金资助:*本文系国家自然科学青年基金项目“基于可信语义Wiki的知识库构建方法与应用研究”(项目编号: 71203173)和中央高校基本科研业务费专项资金资助项目“大数据环境下基于主题模型的信息服务研究”(项目编号: JB160606)的研究成果之一
引用本文:   
李慧, 胡云凤. 基于动态情感主题模型的在线评论分析*[J]. 数据分析与知识发现, 2017, 1(9): 74-82.
Li Hui,Hu Yunfeng. Analyzing Online Reviews with Dynamic Sentiment Topic Model. Data Analysis and Knowledge Discovery, 2017, 1(9): 74-82.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.09.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I9/74
  SSTM模型的图模型表示[7]
  DSTM模型的图模型表示
参数 具体含义
α 主题θ的先验狄利克雷参数
θ 情感s的主题分布
z 文档中词汇的主题
π 文档的情感分布
s 文档采样的某一情感
φ 主题的词分布
wi 文档中的第i个词汇
E 文档集的情感数量
D 文档子集中的文档数量
W 文档中的词汇数量
K 文档集的主题数量
  模型中的参数说明
  各个时间片上的评论数据分布
  不同主题数目上的情感判别精度
积极情感 消极情感
主题1 主题2 主题3 主题5 主题6
样子 系统 功能 发热 灵敏
手机 反应 软件 失灵 屏幕
操作 卸载
后盖 四核 配置 充电 触屏
顺手 齐全 不行 分辨率
做工 内存 通话 电池
速度 性价比 字体
漂亮 流畅 像素 充电器
配置 运行 信号 每天 失灵
电源键 性能 毫安
  第一个时间片的部分主题
  主题1在不同时间片上内容变化
  主题1在不同时间片上积极情感概率变化
  主题5在不同时间片上内容变化
  主题5在不同时间片上消极情感概率变化
  积极情感和消极情感评论数量比例
[1] Somprasertsri G, Lalitrojwong P.Mining Feature-Opinion in Online Customer Reviews for Opinion Summarization[J]. Journal of Universal Computer Science, 2010, 16(6): 938-955.
doi: 10.3217/jucs-016-06-0938
[2] Zhuang L, Jing F, Zhu X Y.Movie Review Mining and Summarization[C]// Proceedings of the 15th ACM International Conference on Information and Knowledge Management. ACM, 2006: 43-50.
[3] Hu M, Liu B.Mining and Summarizing Customer Reviews[C]// Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, Washington, USA. 2004: 168-177.
[4] Jo Y, Oh A H.Aspect and Sentiment Unification Model for Online Review Analysis[C]//Proceedings of the 4th ACM International Conference on Web Search and Data Mining. ACM, 2011: 815-824.
[5] Lin C, He Y, Everson R, et al.Weakly Supervised Joint Sentiment-topic Detection from Text[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(6): 1134-1145.
doi: 10.1109/TKDE.2011.48
[6] Blei D M, Ng A Y, Jordan M I.Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[7] 熊蜀峰, 姬东鸿. 面向产品评论分析的短文本情感主题模型[J]. 自动化学报, 2016, 42(8): 1227-1237.
doi: 10.16383/j.aas.2016.c150591
[7] (Xiong Shufeng, Ji Donghong.A Short Text Sentiment-topic Model for Product Review Analysis[J]. Acta Automatica Sinica, 2016, 42(8): 1227-1237.)
doi: 10.16383/j.aas.2016.c150591
[8] Blei D M, Lafferty J D.Dynamic Topic Models[C]// Proceedings of the 23rd International Conference on Machine Learning. 2006: 113-120.
[9] Griffiths T L, Steyversm M.Finding Scientific Topics[J]. Proceedings of the National Academy of Science of the United States of America, 2004, 101(S1): 5228-5235.
doi: 10.1073/pnas.0307752101
[10] Alsumaitl L, Barbará D, Domeniconic C.On-line LDA: Adaptive Topic Models for Mining Text Streams with Applications to Topic Detection and Tracking[C]// Proceedings of the 8th IEEE International Conference on Data Mining. 2008.
[11] Yan X, Guo J, Lan Y, et a1. A Biterm Topic Model for Short Texts[C]//Proceedings of the 22nd International Conference on World Wide Web. 2013.
[12] Andrzejewski D, Zhu X.Latent Dirichlet Allocation with Topic-in-Set Knowledge[C]// Proceedings of the NAACL HLT 2009 Workshop on Semi-Supervised Learning for Natural Language Processing.2009: 43-48.
[13] Xu H, Zhang F, Wang W.Implicit Feature Identification in Chinese Reviews Using Explicit Topic Mining Model[J]. Knowledge-Based Systems, 2015, 76: 166-175.
doi: 10.1016/j.knosys.2014.12.012
[14] 李实. 中文网络客户评论中的产品特征挖掘方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2009.
[14] (Li Shi.Research on the Approaches of Mining Product Features from Chinese Customer Reviews on the Internet [D]. Harbin: Harbin Institute of Technology, 2009.)
[15] 李超雄, 黄发良, 温肖谦, 等. 基于动态主题情感混合模型的微博主题情感演化分析方法[J]. 计算机应用, 2015, 35(10): 2905-2910.
doi: 10.11772/j.issn.1001-9081.2015.10.2905
[15] (Li Chaoxiong, Huang Faliang, Wen Xiaoqian, et al.Evolution Analysis Method of Microblog Topic-Sentiment Based on Dynamic Topic Sentiment Combining Model[J]. Journal of Computer Applications, 2015, 35(10): 2905-2910.)
doi: 10.11772/j.issn.1001-9081.2015.10.2905
[16] 徐戈, 王厚峰. 自然语言处理中主题模型的发展[J]. 计算机学报, 2011, 34(8): 1423-1436.
[16] (Xu Ge, Wang Houfeng.The Development of Topic Models in Natural Language Processing[J]. Chinese Journal of Computers, 2011, 34(8): 1423-1436.)
[1] 范涛,王昊,吴鹏. 基于图卷积神经网络和依存句法分析的网民负面情感分析研究*[J]. 数据分析与知识发现, 2021, 5(9): 97-106.
[2] 徐月梅, 王子厚, 吴子歆. 一种基于CNN-BiLSTM多特征融合的股票走势预测模型*[J]. 数据分析与知识发现, 2021, 5(7): 126-138.
[3] 谢豪,毛进,李纲. 基于多层语义融合的图文信息情感分类研究*[J]. 数据分析与知识发现, 2021, 5(6): 103-114.
[4] 钟佳娃,刘巍,王思丽,杨恒. 文本情感分析方法及应用综述*[J]. 数据分析与知识发现, 2021, 5(6): 1-13.
[5] 刘彤,刘琛,倪维健. 多层次数据增强的半监督中文情感分析方法*[J]. 数据分析与知识发现, 2021, 5(5): 51-58.
[6] 王雨竹,谢珺,陈波,续欣莹. 基于跨模态上下文感知注意力的多模态情感分析 *[J]. 数据分析与知识发现, 2021, 5(4): 49-59.
[7] 李菲菲,吴璠,王中卿. 基于生成式对抗网络和评论专业类型的情感分类研究 *[J]. 数据分析与知识发现, 2021, 5(4): 72-79.
[8] 陈君,梁昊,钱晨. 情感距离视角下奖励式众筹用户投资决策行为研究*——基于项目文本的分析[J]. 数据分析与知识发现, 2021, 5(4): 60-71.
[9] 常城扬,王晓东,张胜磊. 基于深度学习方法对特定群体推特的动态政治情感极性分析*[J]. 数据分析与知识发现, 2021, 5(3): 121-131.
[10] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[11] 韩普, 张伟, 张展鹏, 王宇欣, 方浩宇. 基于特征融合和多通道的突发公共卫生事件微博情感分析*[J]. 数据分析与知识发现, 2021, 5(11): 68-79.
[12] 王伟, 高宁, 徐玉婷, 王洪伟. 基于LDA的众筹项目在线评论主题动态演化分析*[J]. 数据分析与知识发现, 2021, 5(10): 103-123.
[13] 吕华揆,刘政昊,钱宇星,洪旭东. 异质性财经新闻与股市关系研究*[J]. 数据分析与知识发现, 2021, 5(1): 99-111.
[14] 代建华, 邓育彬. 基于情感膨胀门控CNN的情感-原因对提取*[J]. 数据分析与知识发现, 2020, 4(8): 98-106.
[15] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn