Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (11): 82-90     https://doi.org/10.11925/infotech.1003-3513.2015.11.12
  应用论文 本期目录 | 过刊浏览 | 高级检索 |
情感分析及可视化方法在网络视频弹幕数据分析中的应用
郑飏飏1, 徐健1, 肖卓2
1 中山大学资讯管理学院 广州 510006;
2 中山大学图书馆 广州 510275
Utilization of Sentiment Analysis and Visualization in Online Video Bullet-screen Comments
Zheng Yangyang1, Xu Jian1, Xiao Zhuo2
1 School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China;
2 Libraries of Sun Yat-Sen University, Guangzhou 510275, China
全文: PDF (1992 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]利用情感分析技术提取弹幕评论中包含的情感数据并对其进行可视化, 获取网络视频的情感特征及走势。[应用背景]网络视频弹幕中的评论信息经情感分析及可视化处理后可作为视频的情感标签, 在此基础上建立基于评论情感的视频检索模式。[方法]利用句子级别的情感分析方法, 建立基于情感词典的弹幕情感分析模型, 对评论文本进行情感词抽取及情感值计算, 并结合时间序列进行分析。[结果]获取弹幕中的情感数据, 绘制弹幕评论的多维情感类别雷达图、情感词标签云和情感趋势曲线等。[结论]利用情感分析及可视化方法, 可以帮助用户获取网络视频弹幕数据中包含的情感信息, 进而提供一种新的视频检索途径。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract

[Objective] By collecting and visualizing the sentiment information from bullet-screen comments, we can extract the emotion features and the trend of online videos.[Context] The visualized information of bullet-screen comments can be considered as sentiment tags. Based on these labels of online video, a new retrieval model focusing on comment emotion can be raised.[Methods] According to sentence level sentiment analysis, the study model of sentiment analysis towards bullet-screen comments is developed, including process of constructing sentiment word dictionary, extracting sentiment words and calculating weight value of comments based on time series.[Results] Analyzing tools of radar map, tag cloud and trend-curve diagram are utilized to present the outcome.[Conclusions] Sentiment analysis and visualization methods utilized in bullet-screen comments can provide a new approach to retrieve online videos.

收稿日期: 2015-06-08      出版日期: 2016-04-06
:  G250  
基金资助:

本文系国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”(项目编号:11CTQ022)的研究成果之一。

通讯作者: 徐健, ORCID: 0000-0003-4886-4708, E-mail: issxj@mail.sysu.edu.cn。     E-mail: issxj@mail.sysu.edu.cn
作者简介: 作者贡献声明:徐健, 郑飏飏: 提出研究思路, 设计研究方案; 郑飏飏, 肖卓: 进行实验, 采集、处理和分析数据; 郑飏飏, 徐健, 肖卓: 论文起草; 徐健: 论文最终版本修订。
引用本文:   
郑飏飏, 徐健, 肖卓. 情感分析及可视化方法在网络视频弹幕数据分析中的应用[J]. 现代图书情报技术, 2015, 31(11): 82-90.
Zheng Yangyang, Xu Jian, Xiao Zhuo. Utilization of Sentiment Analysis and Visualization in Online Video Bullet-screen Comments. New Technology of Library and Information Service, 2015, 31(11): 82-90.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.11.12      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2015/V31/I11/82

[1] AcFun弹幕视频网[DB/OL]. [2015-04-17]. http://www.acfun. tv/. (AcFun [DB/OL]. [2015-04-17]. http://www.acfun.tv/.)
[2] 哔哩哔哩弹幕视频网[DB/OL]. [2015-04-17]. http://www. bilibili.com/. (bilibili [DB/OL]. [2015-04-17]. http://www. bilibili.com/.)
[3] Pang B, Lee L. Thumbs up?: Sentiment Classification Using Machine Learning Techniques [C]. In: Proceedings of the Conference on Empirical Methods in NLP. Morristown: ACL, 2002: 79-86.
[4] 刘志明, 刘鲁. 基于机器学习的中文微博情感分类实证研究[J]. 计算机工程与应用, 2012, 48(1): 1-4. (Liu Zhiming, Liu Lu. Empirical Study of Sentiment Classification for Chinese Microblog Based on Machine Learning [J]. Computer Engineering and Applications, 2012, 48(1): 1-4.)
[5] Yu H, Hatzivassiloglou V. Towards Answering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences [C]. In: Proceedings of the Conference on Empirical Methods in NLP. Morristown: ACL, 2003:129-136.
[6] Hu M, Liu B. Mining and Summarizing Customer Reviews [C]. In: Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2004:168-177.
[7] Kim S M, Hovy E. Determining the Sentiment of Opinions [C]. In:Proceedings of the 20th International Conference on Computational Linguistics. Morristown: ACL, 2004: 1367-1373.
[8] Yang S, Li S, Zheng L, et al. Emotion Mining Reasearch on Microblog [C]. In: Proceedings of the 1st IEEE Symposium on Web Society (SWS'09). 2009: 71-75.
[9] 徐琳宏, 林鸿飞, 赵晶. 情感语料库的构建和分析[J]. 中文信息学报, 2008, 22(1): 116-122. (Xu Linhong, Lin Hongfei, Zhao Jing. Construction and Analysis of Emotional Corpus [J]. Journal of Chinese Information Processing, 2008, 22(1): 116-122.)
[10] 刨丁解羊中文分词器v3.2 [K/OL]. [2015-04-17]. http://www. crsky.com/soft/22209.html. (Paodingjieyang Chinese Word Segmentation Machine [K/OL]. [2015-04-17]. http://www.crsky. com/soft/22209.html.)
[11] Rao D, Ravichandran D. Semi-Supervised Polarity Lexicon Induction [C]. In: Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics. Morristown: ACL, 2009: 675-682.
[12] 杜振雷. 面向微博短文本的情感分析研究[D]. 北京: 北京信息科技大学, 2013. (Du Zhenlei. Sentiment Analysis Towards Microblog Short Text [D]. Beijing: Beijing Information Science and Technology University, 2013.)
[13] 谢丽星, 周明, 孙茂松. 基于层次结构的多策略中文微博情感分析和特征抽取[J]. 中文信息学报, 2012, 26(1): 73-83. (Xie Lixing, Zhou Ming, Sun Maosong. Hierarchical Structure Based Hybrid Approach to Sentiment Analysis of Chinese Micro Blog and Its Feature Extraction [J]. Journal of Chinese Information Processing, 2012, 26(1): 73-83.)
[14] TagxeDo: 在线云词成像制作工具[K/OL]. [2015-04-17]. http:// www.tagxedo.com/. (TagxeDo [K/OL]. [2015-04-17]. http://www. tagxedo.com/.)

[1] 柴庆凤, 史霖炎, 梅珊, 熊海涛, 贺惠新. 基于人工特征和机器特征融合的科技文献知识元抽取*[J]. 数据分析与知识发现, 2021, 5(8): 132-144.
[2] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[3] 王勤洁, 秦春秀, 马续补, 刘怀亮, 徐存真. 基于作者偏好和异构信息网络的科技文献推荐方法研究*[J]. 数据分析与知识发现, 2021, 5(8): 54-64.
[4] 韩普,张展鹏,张明淘,顾亮. 基于多特征融合的中文疾病名称归一化研究*[J]. 数据分析与知识发现, 2021, 5(5): 83-94.
[5] 李贺,刘嘉宇,李世钰,吴迪,金帅岐. 基于疾病知识图谱的自动问答系统优化研究*[J]. 数据分析与知识发现, 2021, 5(5): 115-126.
[6] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[7] 伊惠芳,刘细文. 一种专利技术主题分析的IPC语境增强Context-LDA模型研究[J]. 数据分析与知识发现, 2021, 5(4): 25-36.
[8] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[9] 常志军,钱力,谢靖,吴振新,张鹄,于倩倩,王颖,王永吉. 基于分布式技术的科技文献大数据平台的建设研究*[J]. 数据分析与知识发现, 2021, 5(3): 69-77.
[10] 胡少虎,张颖怡,章成志. 关键词提取研究综述*[J]. 数据分析与知识发现, 2021, 5(3): 45-59.
[11] 刘彤, 刘琛, 倪维健. 多层次数据增强的半监督中文情感分析方法 [J]. 数据分析与知识发现, 0, (): 1-.
[12] 王红斌, 王健雄, 张亚飞, 杨恒. 主题不平衡新闻文本数据集的主题识别方法研究 [J]. 数据分析与知识发现, 0, (): 1-.
[13] 张思凡, 牛振东, 陆浩, 朱一凡, 王荣荣. 基于图卷积嵌入与特征交叉的文献被引量预测方法:以交通运输领域为例 [J]. 数据分析与知识发现, 0, (): 1-.
[14] 祁瑞华, 简悦, 郭旭, 关菁华, 杨明昕. 融合特征与注意力的跨领域产品评论情感分析 [J]. 数据分析与知识发现, 0, (): 1-.
[15] 李娇, 黄永文, 罗婷婷, 赵瑞雪, 鲜国建. 基于多因子算法的自动分类研究 [J]. 数据分析与知识发现, 0, (): 1-.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn