Please wait a minute...
Advanced Search
数据分析与知识发现  2020, Vol. 4 Issue (12): 45-54     https://doi.org/10.11925/infotech.2096-3467.2020.0959
     专题 本期目录 | 过刊浏览 | 高级检索 |
突发公共卫生事件误导信息受众情感分析及传播特征研究*
张翼鹏,马敬东()
华中科技大学同济医学院医药卫生管理学院 武汉 430030
Analyzing Sentiments and Dissemination of Misinformation on Public Health Emergency
Zhang Yipeng,Ma Jingdong()
School of Medicine and Health Management, Tongji Medical College, Huazhong University of Science and Technology, Wuhan 430030, China
全文: PDF (1261 KB)   HTML ( 20
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 以新冠肺炎流行期间新浪微博数据为基础,通过文本挖掘的方式获取突发公共卫生事件中的误导信息,揭示误导信息的受众情感特征及其对信息传播的影响。【方法】 使用机器学习的方法对相关微博进行分类判别,使用LDA主题模型获取微博相应主题信息,使用词典法对微博相应的评论进行情感极性判别,使用t检验分别对受众情感不同的误导信息微博的评论数、转发数和点赞数进行比较。【结果】 样本数据中,误导信息占比为46.28%,误导信息和非误导信息相应微博的评论为负面情感的占比分别为59.32%和54.49%;误导信息中,评论为负面情感的微博的评论数、转发数和点赞数分别比评论为正面情感的微博平均多2.26、2.68和3.29次。【局限】 未对非误导信息的传播特征进行研究分析,不排除其与误导信息特征相似的可能;仅选取“新冠肺炎疫情”一个案例,未来需要对更多案例进行横向比较。【结论】 突发公共卫生事件中,网络社交媒体中存在相当比重的误导信息。相较于非误导信息,误导信息受众的负向情感比重高。在误导信息中,负面情感的信息相较正面情感的信息转发传播次数多,受众参与程度高。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张翼鹏
马敬东
关键词 突发公共卫生事件误导信息情感分析信息传播    
Abstract

[Objective] This paper examines mis-information on public health emergency (i.e., the COVID-19 epidemic), aiming to reveal the public’s sentiments on mis-information and the latter’s dissemination patterns. [Methods] We retrieved our data from Sina Weibo and categorized the relevant microblog posts using machine learning techniques. Then, we extracted the post topics with LDA model and decided the emotional polarity of comments using dictionary method. Finally, we used T-test to compare the number of comments, shares and likes received by mis-information posts with different sentiments. [Results] We found that 46.28% of the retrieved blogs had mis-information. 59.32% of the posts with mis-information and 54.49% of the posts with accurate information yielded negative emotion among readers. On average, the misinformation posts with negative sentiments received more comments, shares and likes than those with positive sentiments (2.26, 2.68 and 3.29). [Limitations] We only examined COVID-19 related posts and did not investigate the dissemination of accurate information. [Conclusions] Public health emergency generates much mis-information. The sentiments of misinformation readers are more negative than those of normal information. Weibo posts with misinformation and negative sentiments attract more online participation.

Key wordsPublic Health Emergency    Misinformation    Sentiment Analysis    Information Dissemination
收稿日期: 2020-09-29      出版日期: 2020-10-29
ZTFLH:  TP391  
基金资助:*国家自然科学基金项目“互联网医疗环境下慢病服务互动价值形成机制与价值融合模式研究”(71974065)
通讯作者: 马敬东     E-mail: jdma@hust.edu.cn
引用本文:   
张翼鹏,马敬东. 突发公共卫生事件误导信息受众情感分析及传播特征研究*[J]. 数据分析与知识发现, 2020, 4(12): 45-54.
Zhang Yipeng,Ma Jingdong. Analyzing Sentiments and Dissemination of Misinformation on Public Health Emergency. Data Analysis and Knowledge Discovery, 2020, 4(12): 45-54.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2020.0959      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2020/V4/I12/45
Fig.1  研究思路
预测结果 误导信息 非误导信息 合计
阳性(+) 59 2 61
阴性(-) 3 72 75
合计 62 74 136
Table 1  合并随机森林与SVM分类模型测试结果
Fig.2  新冠肺炎疫情误导信息示例
Fig.3  困惑度-主题数折线图
主题

词语1 词语2 词语3 词语4 词语5 词语6 词语7 词语8 词语9
主题1 取消 病毒 疾病 蝙蝠 河南 重磅 非典 野生 隔离
11.06% 7.49% 6.27% 4.80% 4.61% 1.40% 0.76% 0.75% 0.70%
主题2 疑似 组织 世卫 病例 确诊 传人 症状 全国 新增
5.34% 4.88% 4.35% 4.29% 3.80% 3.75% 3.39% 2.87% 2.57%
主题3 指挥部 治疗 死亡 政策 应急 严重 病房 武汉市 崩溃
6.41% 5.51% 4.30% 3.53% 3.52% 3.20% 3.05% 2.67% 2.27%
主题4 政府 行程 聚集 首例 航班 提醒 支援 减少 交通
8.94% 6.53% 6.40% 5.58% 5.46% 5.25% 2.95% 2.78% 2.46%
主题5 工作 时间 抗疫 口罩 措施 疫情 影响 医疗 呼吸机
15.76% 4.59% 4.57% 4.33% 3.33% 2.85% 2.33% 2.18% 1.89%
主题6 开学 学校 学生 延期 集中 领导组 结束 工作 提前
5.65% 5.41% 4.71% 4.21% 4.04% 3.75% 3.36% 3.16% 3.03%
主题7 加油 国家 累计 英雄 卫健委 确诊 严格 接受 感谢
9.24% 7.82% 7.41% 7.04% 6.32% 5.32% 3.32% 2.91% 2.18%
主题8 发现 院士 关注 网络 钟南山 公主 直播 明天 采访
8.30% 6.62% 5.44% 5.00% 4.76% 4.11% 4.01% 3.40% 1.36%
主题9 美国 世界 核酸 报道 军运会 报告 特朗普 疫情 表示
7.37% 6.85% 6.00% 4.51% 3.29% 2.92% 2.72% 2.39% 2.38%
Table2  肺炎疫情相关微博主题-词分布概率
Fig.4  不同主题微博评论的情感极性分布概率
类别 评论数(平均值±标准差) t p
正面情感 负面情感
病毒起源 29.47±5.22 30.66±16.02 -1.06 0.29
病例通报 20.45±11.94 23.91±12.87 -2.29 0.02
疫情冲击和影响 28.89±13.94 31.37±14.78 -1.39 0.16
交通状况 21.26±13.35 28.52±15.49 -4.18 0.00
物资状况 24.83±9.95 22.09±11.53 2.44 0.02
学习工作状态 18.39±10.64 20.97±10.72 -1.89 0.06
鼓舞士气 22.61±12.99 21.09±14.28 1.10 0.27
关键意见领袖 29.02±12.00 32.15±11.90 -2.69 0.01
国际疫情 25.12±11.22 24.89±13.69 0.19 0.85
合计 24.51±12.18 26.77±14.33 -4.84 0.00
Table3  正面情感和负面情感的微博评论数t检验
类别 转发数(平均值±标准差) t p
正面情感 负面情感
病毒起源 23.85±10.99 28.51±13.87 3.20 0.00
病例通报 25.68±12.36 21.73±13.33 -2.53 0.01
疫情冲击和影响 25.68±13.75 21.73±15.42 1.69 0.09
交通状况 19.08±11.21 24.01±12.12 3.53 0.00
物资状况 24.86±13.66 30.57±11.65 4.19 0.00
学习工作状态 20.75±8.38 19.10±11.77 -1.30 0.20
鼓舞士气 21.59±8.39 20.72±13.23 -0.73 0.47
关键意见领袖 27.43±11.41 31.50±16.91 2.92 0.00
国际疫情 22.91±10.35 25.98±14.99 2.44 0.02
合计 23.43±11.23 26.11±14.47 5.94 0.00
Table4  正面情感和负面情感的微博转发数t检验
类别 点赞数(平均值±标准差) t p
正面情感 负面情感
病毒起源 48.75±37.41 58.62±39.10 2.05 0.04
病例通报 51.56±29.25 46.44±29.37 -1.46 0.15
疫情冲击和影响 58.45±35.77 59.63±36.06 0.27 0.79
交通状况 48.34±39.17 55.93±39.33 1.64 0.10
物资状况 56.52±43.65 55.38±41.77 -0.25 0.80
学习工作状态 48.14±34.55 47.78±30.38 -0.09 0.93
鼓舞士气 46.84±33.76 44.72±32.63 -0.62 0.54
关键意见领袖 59.54±46.09 63.43±41.92 0.91 0.36
国际疫情 55.25±36.34 66.41±39.13 3.05 0.00
合计 52.77±38.30 56.06±37.74 2.43 0.02
Table 5  正面情感和负面情感的微博点赞数t检验
[1] Kušen E, Strembeck M . Politics, Sentiments, Misinformation: An Analysis of the Twitter Discussion on the 2016 Austrian Presidential Elections[J]. Online Social Networks and Media, 2018,5:37-50.
[2] Wang Y X, McKee M, Torbica A , et al. Systematic Literature Review on the Spread of Health-related Misinformation on Social Media[J]. Social Science & Medicine, 2019,240:112552.
doi: 10.1016/j.socscimed.2019.112552 pmid: 31561111
[3] Radwan E, Radwan A . The Spread of the Pandemic of Social Media Panic During the COVID-19 Outbreak[J]. European Journal of Environment and Public Health, 2020. DOI: 10.29333/ejeph/8277.
doi: 10.20897/ejeph/3925 pmid: 31259311
[4] Vicario M D, Quattrociocchi W, Scala A , et al. Polarization and Fake News: Early Warning of Potential Misinformation Targets[J]. ACM Transactions on the Web (TWEB), 2019,13(2):1-22.
[5] Van Kleef G A . The Emerging View of Emotion as Social Information[J]. Social and Personality Psychology Compass, 2010,4(5):331-343.
[6] Bavel J J V, Baicker K, Boggio P S , et al. Using Social and Behavioural Science to Support COVID-19 Pandemic Response[J]. Nature Human Behaviour, 2020,4(5):460-471.
doi: 10.1038/s41562-020-0884-z pmid: 32355299
[7] Lewandowsky S, Stritzke W G K, Freund A M , et al. Misinformation, Disinformation, and Violent Conflict: From Iraq and the “War on Terror” to Future Threats to Peace[J]. American Psychologist, 2013,68(7):487-501.
[8] Krause N M, Freiling I, Beets B , et al. Fact-Checking as Risk Communication: The Multi-Layered Risk of Misinformation in Times of COVID-19[J]. Journal of Risk Research, 2020. DOI: 10.1080/13669877.2020.1756385.
doi: 10.1080/13669870802261595 pmid: 19169420
[9] Jain S, Sharma V, Kaushal R. Towards Automated Real-Time Detection of Misinformation on Twitter [C]//Proceedings of 2016 International Conference on Advances in Computing, Communications and Informatics (ICACCI). IEEE, 2016.
[10] Qazvinian V, Rosengren E, Radev D R, et al. Rumor Has It: Identifying Misinformation in Microblogs [C]//Proceedings of Conference on Empirical Methods in Natural Language Processing. Association for Computational Linguistics. 2011: 1589-1599.
[11] Fabiana Z, Kralj N P, Michela D V , et al. Emotional Dynamics in the Age of Misinformation[J]. PLoS One, 2015,10(9):e0138740.
doi: 10.1371/journal.pone.0138740 pmid: 26422473
[12] 赵雅甜 . 社会安全事件网络舆情的情感特征及引导对策研究——以“滴滴打车空姐遇害”事件为例[D]. 湘潭: 湘潭大学, 2019.
[12] ( Zhao Yatian . Research on Emotional Characteristics and Guiding Countermeasures of Network Public Opinions on Social Security Events[D]. Xiangtan: Xiangtan University, 2019.)
[13] 吴雨青 . 网络抗争事件的情绪传播和引导——以泸县学生坠亡事件为例[D]. 武汉: 华中科技大学, 2018.
[13] ( Wu Yuqing . Emotion Communication and Guidance in Online Protest - A Study Case of Luxian Student’s Falling Dead Case[D]. Wuhan: Huazhong University of Science and Technology, 2018.)
[14] 杨莉 . 基于LDA和XGBoost模型的环境公共服务微博情感分析[J]. 南京邮电大学学报(社会科学版), 2019,21(6):23-39.
[14] ( Yang Li . Microblog Sentiment Analysis of Jiangsu Environmental Public Service Based on LDA and XGBoost Models[J]. Journal of Nanjing University of Posts and Telecommunications (Social Science), 2019,21(6):23-39.)
[15] Syed-Abdul S, Fernandez-Luque L, Jian W S , et al. Misleading Health-Related Information Promoted Through Video-Based Social Media: Anorexia on YouTube[J]. Journal of Medical Internet Research, 2013,15(2):e30.
doi: 10.2196/jmir.2237 pmid: 23406655
[16] Li O Y, Bailey A, Huynh D , et al. YouTube as a Source of Information on COVID-19: A Pandemic of Misinformation?[J]. British Medical Journal Global Health, 2020,5(5):e002604.
[17] Pathak R, Poudel D R, Karmacharya P , et al. YouTube as a Source of Information on Ebola Virus Disease[J]. North American Journal of Medical Sciences, 2015,7(7):306-309.
doi: 10.4103/1947-2714.161244 pmid: 26258077
[18] Sharma M, Yadav K, Yadav N , et al. Zika Virus Pandemic—Analysis of Facebook as a Social Media Health Information Platform[J]. American Journal of Infection Control, 2017,45(3):301-302.
[19] Pennycook G, Mcphetres J, Zhang Y , et al. Fighting COVID-19 Misinformation on Social Media: Experimental Evidence for a Scalable Accuracy-Nudge Intervention[J]. Psychological Science, 2020,31(7):770-780.
doi: 10.1177/0956797620939054 pmid: 32603243
[20] Pulido C M, Villarejo-Carballido B, Redondo-Sama G , et al. COVID-19 Infodemic: More Retweets for Science-Based Information on Coronavirus than for False Information[J]. International Sociology, 2020,35(4):377-392.
[21] Sharma K, Seo S, Meng C Z , et al. Covid-19 on Social Media: Analyzing Misinformation in Twitter Conversations[OL]. arXiv Preprint, arXiv: 2003. 12309.
[22] 曾子明, 王婧 . 基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例[J]. 情报学报, 2019,38(1):89-96.
[22] ( Zeng Ziming, Wang Jing . Research on Microblog Rumor Identification Based on LDA and Random Forest[J]. Journal of the China Society for Scientific and Technical Information, 2019,38(1):89-96.)
[23] DiFonzo N, Bordia P . Rumor Psychology: Social and Organizational Approaches[M]. Washington DC, US: American Psychological Association, 2007.
[24] Knapp R H . A Psychology of Rumor[J]. Public Opinion Quarterly, 1944,8(1):22-37.
[25] Breiman L . Random Forests[J]. Machine Learning, 2001,45(1):5-32.
[26] Cherkassky V . The Nature of Statistical Learning Theory[J]. IEEE Transactions on Neural Networks, 1997,8(6):1564.
[27] Blei D M, Ng A Y, Jordan M I . Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003(3):993-1022.
[28] 蔡梦思 . 社交网络中用户情感挖掘及传播特征分析[D]. 湘潭: 湘潭大学, 2017.
[28] ( Cai Mengsi . Analysis on the Sentiment Mining and Transmission Characteristics in Social Network[D]. Xiangtan: Xiangtan University, 2017.)
[29] 田占伟 . 基于复杂网络的微博信息传播研究[D]. 哈尔滨: 哈尔滨工业大学, 2012.
[29] ( Tian Zhanwei . Research on Information Dissemination of Micro-Blog Based on Complex Network[D]. Harbin: Harbin Institute of Technology, 2012.)
[30] Ma R . Media, Crisis, SARS: An Introduction[J]. Asian Journal of Communication, 2005,15(3):241-246.
[31] 杨志兵 . 误导信息特点分析及其传播意愿影响因素的研究[D]. 西安: 第四军医大学, 2016.
[31] ( Yang Zhibing . Characteristic Analysis of Misinformation and Its Influence Factors for Transmission Intention[D]. Xi’an: The Fourth Military Medical University, 2016.)
[32] 刘志明, 刘鲁 . 面向突发事件的群体情绪监控预警[J]. 系统工程, 2010,28(7):66-73.
[32] ( Liu Zhiming, Liu Lu . Public Emotion Monitoring and Surveillance in Emergencies[J]. System Engineering, 2010,28(7):66-73.)
[33] Gross J J . Emotion Regulation[J]. Handbook of Emotions, 2008,3(3):497-513.
[1] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[2] 姜霖,张麒麟. 基于引文细粒度情感量化的学术评价研究*[J]. 数据分析与知识发现, 2020, 4(6): 129-138.
[3] 石磊,王毅,成颖,魏瑞斌. 自然语言处理中的注意力机制研究综述*[J]. 数据分析与知识发现, 2020, 4(5): 1-14.
[4] 李铁军,颜端武,杨雄飞. 基于情感加权关联规则的微博推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 27-33.
[5] 沈卓,李艳. 基于PreLM-FT细粒度情感分析的餐饮业用户评论挖掘[J]. 数据分析与知识发现, 2020, 4(4): 63-71.
[6] 薛福亮,刘丽芳. 一种基于CRF与ATAE-LSTM的细粒度情感分析方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[7] 谭荧,张进,夏立新. 社交媒体情境下的情感分析研究综述[J]. 数据分析与知识发现, 2020, 4(1): 1-11.
[8] 聂卉,何欢. 引入词向量的隐性特征识别研究*[J]. 数据分析与知识发现, 2020, 4(1): 99-110.
[9] 岑咏华,谭志浩,吴承尧. 财经媒介信息对股票市场的影响研究: 基于情感分析的实证 *[J]. 数据分析与知识发现, 2019, 3(9): 98-114.
[10] 卢伟聪,徐健. 基于三分网络的网络用户评论情感分析 *[J]. 数据分析与知识发现, 2019, 3(8): 10-20.
[11] 尤众喜,华薇娜,潘雪莲. 中文分词器对图书评论和情感词典匹配程度的影响 *[J]. 数据分析与知识发现, 2019, 3(7): 23-33.
[12] 安璐,梁艳平. 突发公共卫生事件微博话题与用户行为选择研究*[J]. 数据分析与知识发现, 2019, 3(4): 33-41.
[13] 王林,王可,吴江. 社交媒体中突发公共卫生事件舆情传播与演变*——以2018年疫苗事件为例[J]. 数据分析与知识发现, 2019, 3(4): 42-52.
[14] 蒋翠清,郭轶博,刘尧. 基于中文社交媒体文本的领域情感词典构建方法研究*[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[15] 余本功, 张培行, 许庆堂. 基于F-BiGRU情感分析的产品选择方法*[J]. 数据分析与知识发现, 2018, 2(9): 22-30.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn