Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (11): 82-90    DOI: 10.11925/infotech.1003-3513.2015.11.12
  应用论文 本期目录 | 过刊浏览 | 高级检索 |
情感分析及可视化方法在网络视频弹幕数据分析中的应用
郑飏飏1, 徐健1, 肖卓2
1 中山大学资讯管理学院 广州 510006;
2 中山大学图书馆 广州 510275
Utilization of Sentiment Analysis and Visualization in Online Video Bullet-screen Comments
Zheng Yangyang1, Xu Jian1, Xiao Zhuo2
1 School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China;
2 Libraries of Sun Yat-Sen University, Guangzhou 510275, China
全文: PDF(1992 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]利用情感分析技术提取弹幕评论中包含的情感数据并对其进行可视化, 获取网络视频的情感特征及走势。[应用背景]网络视频弹幕中的评论信息经情感分析及可视化处理后可作为视频的情感标签, 在此基础上建立基于评论情感的视频检索模式。[方法]利用句子级别的情感分析方法, 建立基于情感词典的弹幕情感分析模型, 对评论文本进行情感词抽取及情感值计算, 并结合时间序列进行分析。[结果]获取弹幕中的情感数据, 绘制弹幕评论的多维情感类别雷达图、情感词标签云和情感趋势曲线等。[结论]利用情感分析及可视化方法, 可以帮助用户获取网络视频弹幕数据中包含的情感信息, 进而提供一种新的视频检索途径。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract

[Objective] By collecting and visualizing the sentiment information from bullet-screen comments, we can extract the emotion features and the trend of online videos.[Context] The visualized information of bullet-screen comments can be considered as sentiment tags. Based on these labels of online video, a new retrieval model focusing on comment emotion can be raised.[Methods] According to sentence level sentiment analysis, the study model of sentiment analysis towards bullet-screen comments is developed, including process of constructing sentiment word dictionary, extracting sentiment words and calculating weight value of comments based on time series.[Results] Analyzing tools of radar map, tag cloud and trend-curve diagram are utilized to present the outcome.[Conclusions] Sentiment analysis and visualization methods utilized in bullet-screen comments can provide a new approach to retrieve online videos.

收稿日期: 2015-06-08     
:  G250  
基金资助:

本文系国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”(项目编号:11CTQ022)的研究成果之一。

通讯作者: 徐健, ORCID: 0000-0003-4886-4708, E-mail: issxj@mail.sysu.edu.cn。     E-mail: issxj@mail.sysu.edu.cn
作者简介: 作者贡献声明:徐健, 郑飏飏: 提出研究思路, 设计研究方案; 郑飏飏, 肖卓: 进行实验, 采集、处理和分析数据; 郑飏飏, 徐健, 肖卓: 论文起草; 徐健: 论文最终版本修订。
引用本文:   
郑飏飏, 徐健, 肖卓. 情感分析及可视化方法在网络视频弹幕数据分析中的应用[J]. 现代图书情报技术, 2015, 31(11): 82-90.
Zheng Yangyang, Xu Jian, Xiao Zhuo. Utilization of Sentiment Analysis and Visualization in Online Video Bullet-screen Comments. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2015.11.12.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.11.12

[1] AcFun弹幕视频网[DB/OL]. [2015-04-17]. http://www.acfun. tv/. (AcFun [DB/OL]. [2015-04-17]. http://www.acfun.tv/.)
[2] 哔哩哔哩弹幕视频网[DB/OL]. [2015-04-17]. http://www. bilibili.com/. (bilibili [DB/OL]. [2015-04-17]. http://www. bilibili.com/.)
[3] Pang B, Lee L. Thumbs up?: Sentiment Classification Using Machine Learning Techniques [C]. In: Proceedings of the Conference on Empirical Methods in NLP. Morristown: ACL, 2002: 79-86.
[4] 刘志明, 刘鲁. 基于机器学习的中文微博情感分类实证研究[J]. 计算机工程与应用, 2012, 48(1): 1-4. (Liu Zhiming, Liu Lu. Empirical Study of Sentiment Classification for Chinese Microblog Based on Machine Learning [J]. Computer Engineering and Applications, 2012, 48(1): 1-4.)
[5] Yu H, Hatzivassiloglou V. Towards Answering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences [C]. In: Proceedings of the Conference on Empirical Methods in NLP. Morristown: ACL, 2003:129-136.
[6] Hu M, Liu B. Mining and Summarizing Customer Reviews [C]. In: Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2004:168-177.
[7] Kim S M, Hovy E. Determining the Sentiment of Opinions [C]. In:Proceedings of the 20th International Conference on Computational Linguistics. Morristown: ACL, 2004: 1367-1373.
[8] Yang S, Li S, Zheng L, et al. Emotion Mining Reasearch on Microblog [C]. In: Proceedings of the 1st IEEE Symposium on Web Society (SWS'09). 2009: 71-75.
[9] 徐琳宏, 林鸿飞, 赵晶. 情感语料库的构建和分析[J]. 中文信息学报, 2008, 22(1): 116-122. (Xu Linhong, Lin Hongfei, Zhao Jing. Construction and Analysis of Emotional Corpus [J]. Journal of Chinese Information Processing, 2008, 22(1): 116-122.)
[10] 刨丁解羊中文分词器v3.2 [K/OL]. [2015-04-17]. http://www. crsky.com/soft/22209.html. (Paodingjieyang Chinese Word Segmentation Machine [K/OL]. [2015-04-17]. http://www.crsky. com/soft/22209.html.)
[11] Rao D, Ravichandran D. Semi-Supervised Polarity Lexicon Induction [C]. In: Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics. Morristown: ACL, 2009: 675-682.
[12] 杜振雷. 面向微博短文本的情感分析研究[D]. 北京: 北京信息科技大学, 2013. (Du Zhenlei. Sentiment Analysis Towards Microblog Short Text [D]. Beijing: Beijing Information Science and Technology University, 2013.)
[13] 谢丽星, 周明, 孙茂松. 基于层次结构的多策略中文微博情感分析和特征抽取[J]. 中文信息学报, 2012, 26(1): 73-83. (Xie Lixing, Zhou Ming, Sun Maosong. Hierarchical Structure Based Hybrid Approach to Sentiment Analysis of Chinese Micro Blog and Its Feature Extraction [J]. Journal of Chinese Information Processing, 2012, 26(1): 73-83.)
[14] TagxeDo: 在线云词成像制作工具[K/OL]. [2015-04-17]. http:// www.tagxedo.com/. (TagxeDo [K/OL]. [2015-04-17]. http://www. tagxedo.com/.)

[1] 刘峰, 张晓林. 科学数据元数据标准述评及其通用化设计研究[J]. 现代图书情报技术, 2015, 31(12): 3-12.
[2] 孙轶楠, 顾立平, 宋秀芳, 刘晶晶, 江娴. 学科数据知识库的政策调研与分析——以生命科学领域为例[J]. 现代图书情报技术, 2015, 31(12): 13-20.
[3] 毕强, 刘健. 数字文献资源内容服务推荐方法研究[J]. 现代图书情报技术, 2015, 31(12): 21-27.
[4] 朱光. 基于零水印的图博档彩色图像资源版权保护策略研究[J]. 现代图书情报技术, 2015, 31(12): 89-94.
[5] 王政军, 俞小怡, 金玉玲. 利用旁路监听技术约束数字资源过量下载[J]. 现代图书情报技术, 2015, 31(12): 95-100.
[6] 金玮, 赵蓉英, 殷鸽. 用户在社会化引文软件中的阅读数据积累程度与有效性分析——以Altmetrics指标为例[J]. 现代图书情报技术, 2015, 31(11): 75-81.
[7] 刘悦如, 郭利敏. 微信公众号互动功能新开发[J]. 现代图书情报技术, 2015, 31(11): 104-109.
[8] 章成志, 顾晓雪. 区分标签质量的机器生成标签聚类研究[J]. 现代图书情报技术, 2015, 31(10): 22-29.
[9] 顾晓雪, 章成志. 标注内容与用户属性结合的标签聚类研究[J]. 现代图书情报技术, 2015, 31(10): 30-39.
[10] 刘丹. 利用Apache Mahout部署个性化图书推荐服务[J]. 现代图书情报技术, 2015, 31(10): 102-108.
[11] 马雨萌, 郭进京, 王昉. e-Science环境下科学数据语义组织模型框架研究[J]. 现代图书情报技术, 2015, 31(7-8): 48-57.
[12] 吴丹, 冉爱华. 移动阅读应用的用户体验比较研究[J]. 现代图书情报技术, 2015, 31(7-8): 73-79.
[13] 陈挺, 韩涛, 李泽霞, 李国鹏, 王小梅. 科研项目布局差异对比方法研究——以NSF和EUFP项目为例[J]. 现代图书情报技术, 2015, 31(7-8): 89-96.
[14] 郭振英, 赵文兵, 魏育辉. 轻量级书目本体关联数据建设实践[J]. 现代图书情报技术, 2015, 31(7-8): 139-143.
[15] 郭利敏, 刘悦如, 相明琼. 微信二维码用于图书馆读者身份认证的实践[J]. 现代图书情报技术, 2015, 31(7-8): 144-147.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn