Advanced Search

数据分析与知识发现, 2020, 4(2/3): 122-133 doi: 10.11925/infotech.2096-3467.2019.0732

专辑

同类突发公共卫生事件微博话题共振研究*

梁艳平1, 安璐,,1,2, 刘静2

1武汉大学信息资源研究中心 武汉 430072

2武汉大学信息管理学院 武汉 430072

Topic Resonance of Micro-blogs on Similar Public Health Emergencies

Liang Yanping1, An Lu,,1,2, Liu Jing2

1Center for Studies of Information Resources, Wuhan University, Wuhan 430072, China

2School of Information Management, Wuhan University, Wuhan 430072, China

通讯作者: 安璐,ORCID:0000-0002-5408-7135,E-mail:anlu97@163.com

收稿日期: 2019-06-21   修回日期: 2019-08-7   网络出版日期: 2020-02-25

基金资助: *本文系教育部哲学社会科学研究重大课题攻关项目“提高反恐怖主义情报信息工作能力对策研究”.  17JZD034
国家自然科学基金重大课题“国家安全大数据综合信息集成与分析方法”.  71790612
国家自然科学基金青年项目“突发公共卫生事件社交媒体信息主题演化与影响力建模”的研究成果之一.  71603189

Received: 2019-06-21   Revised: 2019-08-7   Online: 2020-02-25

摘要

【目的】 探索同类突发公共卫生事件中微博用户在各话题类型上的共振规律。【方法】 以朗之万方程为基础构建突发公共卫生事件子话题的随机共振模型,以新浪微博上关于山东问题疫苗事件和长春长生狂犬病疫苗事件的微博数据为例,通过计算其话题因素、地域因素、态度值和话题热度,分析同类突发事件中微博话题共振规律。【结果】 在同类突发公共卫生事件中,事件进展、群众意见、政府回应等话题能够引起明显的话题共振,而知识科普与事后措施相关的微博话题则不能引起共振。【局限】 仅以微博为单一数据源对同类型关联事件中相关话题的共振规律进行研究,研究结论有待使用其他数据和多类型案例进一步验证。【结论】 同类突发公共卫生事件微博话题间存在共振现象,这一现象与相关微博数量、话题内容等因素有关。

关键词: 微博话题 ; 随机共振 ; 朗之万方程 ; 网络舆情 ; 突发事件 ; 同类事件

Abstract

[Objective] This study aims to explore the resonance patterns of micro-blog users on different topics from similar public health emergencies.[Methods] We constrcted a random resonance model for sub-topics of public health emergencies based on the Langevin equation and collected more than 170,000 microblog entries on the Shandong vaccine incident and the Changchun Changsheng vaccine incident from the Sina Weibo platform. We analyzed the resonance pattern of micro-blog topics by calculating topic factors, geography factors, attitude values and topic salience.[Results] The topics about the progress of events, the public opinion, and the government response generated obvious resonance. However, the topics on the background knowledge and post-measures failed to cause resonance from similar public health emergencies.[Limitations] We only analyzed the resonance patterns with micro-blogging topics on two similar events. More research is needed to examine our findings with other cases.[Conclusions] Resonances exist between the topics of similar public health emergencies, which are related to the number of relevant micro-blog entries, topic contents and other factors.

Keywords: Microblogging Topics ; Stochastic Resonance ; Langevin Equation ; Online Public Opinions ; Emergency ; Similar Events

PDF (1341KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

梁艳平, 安璐, 刘静. 同类突发公共卫生事件微博话题共振研究*. 数据分析与知识发现[J], 2020, 4(2/3): 122-133 doi:10.11925/infotech.2096-3467.2019.0732

Liang Yanping. Topic Resonance of Micro-blogs on Similar Public Health Emergencies. Data Analysis and Knowledge Discovery[J], 2020, 4(2/3): 122-133 doi:10.11925/infotech.2096-3467.2019.0732

1 引 言

突发事件根据其影响类型可以划分为自然灾害、事故灾难、公共卫生事件、社会安全事件等4类[1],相同类型或者不同类型间的突发事件往往存在一定的共性,存在相似或者相关的子话题。当相同或者相关事件再次发生时,网民的记忆被唤醒,历史事件再次引起网民关注,在“视网膜效应”的作用下,网民更容易关注曾经在历史事件中关注过的子话题,并且将两起事件的共有话题联合看待。根据“首因效应”[2],网民对当前事件子话题的态度容易被历史印象所影响,发生复杂的情感变化。当网民对某一话题的情绪累积到一定程度时,会发生网络舆情的话题共振。

本文以两起同类突发公共卫生事件为例,通过研究微博用户在同类突发公共卫生事件话题上的反应,分析微博用户在不同话题类型上的共振规律。研究发现,一方面能够丰富网络舆情共振的研究内容和分析视角,了解微博用户在突发公共卫生事件话题层面上所发生的共振情况,掌握微博用户对不同话题类型的敏感度;另一方面,有助于丰富突发公共卫生事件知识库的内容,为突发事件舆情监测与预警提供参考,使应急部门能够根据事件话题的类型采取及时有效的控制措施。

2 相关研究

2.1 微博舆情话题研究

微博文本具有明显的短文本特性、稀疏性和形式多样性,传统的话题提取方法并不适用。由Blei等提出的LDA(Latent Dirichlet Allocation)模型是一种经典的主题模型[3],基于词袋假设,将文档表示为多个话题的概率分布。主题发现主要基于聚类思想,通过LDA模型和相关改进聚类算法,考虑文本特征和其他要素挖掘舆情主题。目前较为常用的微博话题聚类方法包括SingPass、层次聚类、增量聚类等[4],不少学者结合话题模型和聚类算法以提高模型准确率,如Zheng等采用基于密度的聚类、DBSCAN与LDA三种主题发现算法构建混合主题贡献模型[5];Mikolov等提出Word2Vec模型[6],利用词的上下文信息,用固定维数的实数表示词,通过词间相似性表示词间的语义信息,解决维度灾难和特征稀疏性问题,并且结合上下文信息,防止语义信息丢失,近年来常用于微博话题聚类[7,8,9]

微博话题热度体现了一段时间内微博用户对特定主题的关注程度,一般从话题相关微博的数量、参与人数、转发数、评论数、点赞数等量化数据进行直观评价[10,11]。国内外关于社交媒体平台的话题热度研究比较成熟,主要集中在热门话题的监测、话题热度的预测评价。任何网络舆情的发生都是以少数话题为起点逐步传播发酵起来的,及时发现可能引起热议的话题对于把握舆论走向、引导舆论发展具有重要作用,尤其是近年来频繁发生的突发事件往往演变为影响深远的网络舆情事件,因此对热点话题的发现与检测已成为研究热点。热门话题的发现以话题发现为基础,主要采用聚类或者话题模型的方法对网络文本聚类,提取网络文本所包含的话题,然后通过对比话题词频、词频增长率[12,13]等指标筛选出热门话题。词共现和关联规则[14,15]是发现热门话题的主流方法。在话题热度的预测方面,一般将话题的时间序列、用户影响力、话题类型、文本特征等作为影响话题热度的主要因素,利用因子分析或者主成分分析法建立线性回归方程分析话题的发展趋势,预测话题热度[16,17,18]

2.2 突发事件网络舆情共振研究

相同类型或者不同类型之间的多起突发事件经常存在相似性和相关性。突发事件具有显著的瞬时聚众性和破坏性,容易造成社会的巨大损失,给公众留下深刻印象。当相关或者相似事件再次爆发时,事件本身带来的影响,以及以往案例留下的印象可能会引起更加强烈的舆情效应和社会影响,因此近年来多事件网络舆情逐渐成为学者们研究的对象。

关于舆情共振的概念尚无统一的定义,不同学者从不同角度对多事件舆情进行分析。方付建等通过梳理和归纳近年来发生的网络热点舆情事件,发现网络舆情事件不再单独发生,而是同类事件间断或者持续发生的现象,呈现“批量生产”和“同类复制”的特征,从而提出网络舆情热点事件“系列化呈现”的概念[19];兰月新认为网民行为和态度会影响原事件网络舆情的演化,产生新的舆情即衍生舆情,衍生舆情与原事件舆情交织在一起,形成突发事件网络舆情[20];高承实等认为不同时空发生的突发事件,其产生原因和发展趋势或许存在差异,但由于突发事件在某一方面的高度相关,网民根据生活经验和认知容易将其看作同一事件对待,从而产生舆情叠加效应[21]。许多学者在舆情叠加的基础上提出关联叠加[22]、联想叠加[23]的概念。王国华等认为舆情关联是网络热点事件中普遍存在的一种现象,事件之间在主体、主题、情绪等方面发生关联,生成网络热门事件舆情簇和舆情集,使单一事件得到持续发酵、影响更大,多起相关事件的全面呈现也会造成网民的共同关注或序列化认知[24]

综上所述,当前关于微博舆情的研究仍然停留在对微博文本的主题和情感挖掘,通过选择适合微博文本特征的话题和情感抽取方法提高研究结果的准确性。在多事件网络舆情中,学者们主要关注的是多个舆情事件之间的关联方式和关联要素,从宏观角度分析多事件网络舆情的相互作用。已有研究主要着眼于多事件舆情整体的共振规律,忽略了舆情事件子话题之间存在的关联及此关联对舆情事件共振的影响。本文基于随机共振理论,使用朗之万方程建立多起舆情事件话题共振模型,以两起同类突发公共卫生事件为例,利用MATLAB仿真工具[25]分析多起舆情事件中同类话题所发生的共振现象,从微观角度探索多起舆情事件之间的关联。

3 研究设计

3.1 微博话题共振的影响因素分析

网络舆情受到多方面因素的影响,具有复杂的演变规律,在这些因素作用下,引起的用户反应和社会影响也大相径庭。张玉强将影响网络舆情危机的因素分为主体因素和客体因素,主体因素指参与网络舆情事件的行为主体,包括政府、传统媒体、网络媒体、网民、意见领袖5种用户类型,每种用户类型由于其影响力的差别对网络舆情的发展具有不同推动作用;客体因素包括事件、环境、传播技术三个方面[26]。杜诗雨等从参与者、话题、网络三个维度建立微博话题影响指数评价体系,讨论用户影响力、话题讨论强度、网络规模对微博话题生存的影响[27]

借鉴上述学者对微博舆情影响因素的剖析,本文从话题本身和用户参与两个方面分析微博平台中突发公共卫生事件子话题共振的影响因素。其中话题本身包括话题因素、地域因素、话题热度(包括历史事件话题热度、当前事件话题热度);在用户参与方面则主要根据用户类型对突发公共卫生事件微博舆情传播的影响力,将微博用户类型分为政务微博、主流媒体、自媒体、医疗卫生机构、名人、普通用户6种。

3.2 模型构建

Benzi等在研究古气象冰川期与暖气候期交替演化问题时首次提出“随机共振”的概念[28,29]。双稳态非线性随机共振系统是一种经典的随机共振系统,一般用Langevin提出的非线性朗之万方程描述,非线性朗之万方程的一般形式如公式(1)和公式(2)[30]所示。

dxdt=-dUxdt+s(t)+n(t)
Ux=-a2x2+b4x4

其中, x为系统输出,即粒子的运动轨迹, t为时间, Ux是双稳态系统的一般势函数,势函数有两个势阱和一个势垒, ab均是大于0的系统参数。 s(t)表示输入信号, n(t)表示噪声,当输入信号是正弦周期信号,噪声是高斯白噪声时,公式(1)可以表示为如公式(3)[30]

dxdt=ax-bx3+Acos(2πf0t)+Γ(t)

其中, A表示正弦信号的振幅, f0表示正弦信号的频率, Γ(t)表示强度为 t的高斯白噪声。

非线性朗之万方程描绘了悬浮在液体中的花粉粒子在周围水分子热运动的撞击下进行的无规则运动。在网络舆情事件中,网民对舆情话题的关注所引起话题热度的变化类似于水分子对花粉粒子的碰撞所引起的运动状态的改变。网络舆情事件中往往包含不同类型的舆情话题,不同网民具有不同的话题倾向性,具有相似兴趣的网民逐渐形成关于话题的兴趣群体,网民对话题的共同关注对话题热度产生影响,随着时间的推移使话题具有类似于舆情事件的阶段性变化。舆情子话题与舆情事件同样具有酝酿、爆发与平息等阶段,与布朗粒子的运动具有相似之处,因此使用基于双稳态系统的非线性随机微分方程,构建面向突发公共卫生事件子话题的随机共振模型,如公式(4)所示。

x˙=ix-rx3+s1cos(2πpt)+s2

其中, x˙表示布朗粒子的运动轨迹,在突发公共卫生事件微博舆情中则指话题 k的舆情热度。 i表示话题因素, r表示地域因素, ir是势函数的参数,决定了双稳态系统的势垒与势阱,是话题共振的关键因素。 p表示话题 k对应的态度值, t表示时间。 s1s2分别表示话题 k在其所属事件中的相对热度。

3.3 模型因子计算方法

(1) 话题建模

Sievert等搭建了一个基于网络的交互式可视化系统LDAvis[31],该系统利用基于Relevance公式改进的LDA模型,允许用户通过交互式调整确定表征特定话题的最有用的词语。为提高话题的可读性和独立性,本文采用这一方法抽取话题表征词。Relevance公式如公式(5)[32]所示。

r(w,k|λ)=λlog(Φkw)+(l-λ)logΦkwpw

其中, w表示语料库中的词语, k表示话题。 pw表示词语 w在话题-词语分布矩阵 Φ中的边际概率, Φkw表示词语 w与话题 k的相关度。 λ是取值在[0,1]的可变参数, λ趋近于0时,表示话题表征词具有排他性,即在本话题下更独有、更特殊的词与本话题的相关性越强; λ趋近于1时,表示在本话题下出现次数更多的词,更能表征该话题。用户可以通过给定 λ的值,调节词语 w与话题 k的相关程度,即 r(w,k|λ)

(2) 话题因素及地域因素

某一话题的话题因素和地域因素计算方法如公式(6)和公式(7)所示。

ik=tkqk=1ntkq
rk=tkqq=1mtkq

其中, ikrk分别表示话题 k的话题因素和地域因素, tkq表示话题 k在地区 q的热门微博数量。不同类型的突发事件在不同地区的发生频率不同,导致人们对不同事件话题的敏感度存在差异,引起的舆情反应也有区别。因此,不同话题类型的话题因素和地域因素的计算结果也存在较大差异。

(3) 态度值

将微博用户类型分为政务微博、主流媒体、自媒体、医疗卫生机构、名人、普通用户6种,由于不同类型用户的影响力不同,对话题共振的作用也不同。标准差能反映一个数据集的离散程度[33],离散程度则能反映其提供信息的多少。为衡量不同类型微博用户对话题热度的影响,采用标准离差法计算用户权重。

①针对第 i种用户类型下的微博,对每条微博 j的转发数、评论数、点赞数求行为和 bij,以极值法对每条微博的行为和进行标准化,记为 sij

②针对第 i种用户类型下的微博,计算所有微博的均值 s¯i和标准差 σi,如公式(8)和公式(9)所示。

s¯i=1nj=1nsij
σi=j=1n(sij-s¯i)2n-1

③利用标准差计算每类微博用户权重 ui,如公式(10)所示。

ui=σii=1mσi

在微博文本情感强度的计算上,采用情感词典的计算方式,使用BosonNLP情感词典[34]进行计算,对得到的每条微博文本的情感强度分层映射,使其具有一定的规范性,如表1所示。

表1   微博文本情感强度表示

Table 1  Emotional Intensity of Microblogging Posts

情感值e情感强度e̅
e<-100000000000.00
-1000000000≤e<-1000000000.05
-100000000≤e<-100000000.10
-100≤e<-100.45
-10≤e<00.50
0≤e≤100.50
10<e≤1000.55
1000000000<e≤100000000000.95
10000000000<e1.00

新窗口打开| 下载CSV


得到每种微博用户权重和对应的情感强度均值之后,计算微博用户的态度值,如公式(11)所示。

p=i=1mpi×ui

其中, ui即为第 i种微博用户的权重,取值[0,1],且 i=1mui=1pi表示第 i种微博用户的态度强度均值,态度值越趋近于0,表明用户态度越消极;态度值越趋近于1,表明用户态度越积极。6种用户群体的情感加权之和 p作为输入信号的频率。

(4) 话题热度

不同突发公共卫生事件的舆情热度是不同的。为避免由于舆情事件热度的差异对话题共振的结果造成影响,将每种话题在所属事件中的相对热度作为此话题的热度。

网络舆情事件由多个事件子话题组成,其热度是由事件子话题的迁移累积表现出来的。网络舆情发展具有明显的阶段性特征,事件子话题也具有显著的时效性。受事件进展和媒体议程的影响,不同子话题出现的时机和传播的范围存在较大差异,因此受到的关注和产生的影响也有较大区别,对网络舆情热度的提升效应也是不同的。

关于话题热度的度量主要以对应话题的微博数、转发数、评论数、点赞数等定量指标为主,计算方法如公式(12)所示。

Hk=bk×(r¯+c¯+p¯)k=1nbk×(r¯+c¯+p¯)

其中, Hk表示第 k个话题的相对热度。 bk表示微博语料中与话题 k相关的微博数, r¯c¯p¯分别表示相关微博的转发数、评论数、点赞数的平均值。

3.4 数据采集与处理

以“疫苗”为关键词,使用GooSeeker分别收集山东问题疫苗事件(简称山东疫苗事件)2016年3月18日-2016年4月15日相关微博共112 060条、长春长生狂犬病疫苗事件(简称长春疫苗事件)2018年7月15日-2018年8月2日相关微博共508 713条。经过人工筛选,分别保留事件相关微博93 789条、445 574条。每条微博的信息包括用户名称、发布时间、博文内容及相应的转发数、评论数和点赞数。结合本文研究内容,只保留两起事件中转发、评论、点赞数量不全为0的微博,分别为28 790条、151 489条,并以此为研究数据进行分析。

结合博文样本的语言特征,引入搜狗词库中的药品名称、医学词汇、法律词汇、心理学词汇、生物化学词汇作为用户词库,利用基于哈尔滨工业大学停用词表扩展的停用词表,使用Jieba分词工具对所有博文内容分词、去除停用词。

3.5 事件共振验证

廖瑞丹在研究网络舆情共振现象时,以2013年山西乙肝疫苗事件和2016年山东疫苗事件为例,从引发网络舆情共振的主客体因素出发,建立面向网络舆情的随机共振模型,如公式(13)[35]所示。

x˙=ix-rx3+Hcos[(g×p1+h×p2+k×p3+z×p4)t]+s

其中, x˙表示布朗粒子的运动轨迹,即事件热度。 i表示话题因素即事件类型, r表示地域因素。不同地区发生的突发事件类型存在差异,不同议题在不同地区所引起的舆情反应是不同的。 pi表示不同微博用户群体的态度值, ghkz表示不同类型用户的权重,取值[0,1],且 g+h+k+z=1H表示山东疫苗事件的热度,取值[0,1],由人民网舆情检测室发布的舆情热度计算公式得到。 s表示山西乙肝疫苗事件的舆情指数,取值[0,1],参考李倩倩等提出的舆情指数研究方法[36]计算得到。

微博话题是围绕事件产生的,本质上从属于事件。为确保后续研究的有效性和可靠性,本文以2016年山东疫苗事件和2018年长春疫苗事件为研究对象,参考廖瑞丹建立的随机共振模型,分析两起事件是否发生了舆情共振现象。

以中国应急服务网[37]统计的2016年-2018年间事故灾难、自然灾害、社会安全、公共卫生等突发事件为案例库,计算突发公共卫生事件的议题因素和地域因素;使用微博用户权重方法分别计算政务微博、主流媒体、自媒体、医疗卫生机构、名人、普通用户的权重得到态度值;最后以百度指数代表事件热度,最终代入公式(13)进行计算,计算结果如表2所示。

表2   疫苗事件共振模型参数

Table 2  Parameters of the Vaccine Event Resonance Model

话题因素i地域因素r态度值p长生疫苗事件热度H山东疫苗事件舆情指数s
0.030.060.510.610.39

新窗口打开| 下载CSV


图1可以看出,噪声的能量和信号的能量都向低频信号发生偏移,使低频信号发生的频率增高,说明两起疫苗事件发生了随机共振,即长春疫苗事件发生后,网民受到山东疫苗事件的影响,对长生疫苗事件产生了更强烈的情感反应,发生舆情共振。

图1

图1   两起疫苗事件随机共振结果

Fig.1   Stochastic Resonance in Two Vaccine Events


4 同类突发公共卫生事件微博话题共振分析

4.1 话题建模与分类

对采集到的数据集预处理得到两起疫苗事件相关微博语料,根据困惑度曲线初步确定话题数量范围,使用R语言话题可视化包LDAvis[31]多次聚类之后最终确定话题数量分别为56个和85个,分别在 λ=0.48和 λ=0.49时取每个话题的前30个表征词进行话题归纳。

Qu等从博文内容的角度将地震发生后的微博消息类型划分为意见相关型、信息相关型、情感相关型、行动相关型[38,39]。突发事件发生之后,不同网民产生不同的态度和行为,随着用户关系网络的传播不断发生交流并产生共鸣,形成态度鲜明的用户群体。随着舆情事件的不断推进,越来越多的群体加入对事件的关注与讨论,事件信息更加丰富完备,意见领袖和政府部门的回应使舆情产生聚合效应,网民情绪呈现更加复杂的变化。因此,根据突发公共卫生事件的舆情特征,结合两起疫苗事件的文本内容,将突发公共卫生事件子话题归纳为事件进展、群众意见、政府回应、知识科普和事后措施5类,每种话题类型对应的话题内容如表3所示。

表3   话题类型及详情

Table 3  Topic Types

山东疫苗事件长春疫苗事件
事件进展澎湃新闻报道未冷藏疫苗流入多省,或致人命;多家药品批发企业涉山东“疫苗”案被通报;沃森生物子公司被撤销经营执照…国家药监局发布对长春长生的飞行检查结果;国家药监局负责人介绍#长生问题疫苗#案情况:已责令企业停止生产,对企业立案调查;山东查明长春长生25万支百白破疫苗流向,将开展后续补种工作…
群众意见网友要求政府部门尽快查清涉事医院和受害者;家长为孩子健康成长表示担忧;网友谴责政府失职…网友谴责政府部门不作为;网友谴责有人为疫苗事件洗地;网友对祖国的下一代的遭遇感到痛心…
政府回应政府提醒群众到正规疫苗接种单位接种疫苗;世卫组织称问题疫苗的几乎不会产生毒性反应;李克强要求问责疫苗案公职人员…中国疾控中心专家解答疫苗接种有关问题;世卫组织就长春长生疫苗事件发布媒体声明;李克强总理对疫苗事件作出批示…
知识科普注射未冷藏疫苗不能产生病毒抗体;一类疫苗与二类疫苗知识普及1989年美国默克公司将乙肝疫苗技术转让给中国;中国疫苗之父汤飞凡;疫苗的工作原理…
事后措施多地拟将全面实施在预防接种异常反应补偿中全程引入商业保险补偿机制多地开展疫苗冷链运输检查工作;国家药监局:对全部疫苗进行全链条彻查

新窗口打开| 下载CSV


4.2 参数计算

(1) 话题因素及地域因素计算

选取能代表每个话题实际意义的三个表征词作为关键词,在微博平台上分地域检索2016年1月-2018年12月的相关热门微博。以话题1为例,三个话题表征词为检验、监管、药品,以这三个词为关键词组检索中国大陆地区相关热门微博数量,如表4所示。

表4   不同话题类型的热门微博分布情况(单位:条)

Table 4  Popular Weibo Posts Distribution of Different Topic Types

地域

话题类型
事件
进展
群众
意见
政府
回应
知识
科普
事后
措施
合计
华北1855518669453948
东北3710562173240617
华东1604512490533952
华中1234010362267595
西南321110196765071 210
西北22295227564001 000
华南18550115166267783
合计1 2335001 0336922 6676 125

新窗口打开| 下载CSV


根据公式(6)和公式(7)对检索结果的数据进行归一化得到话题因素和地域因素,如表5所示。每个单元格中,第一个数字表示同一话题类型在不同地区的影响力分布,即地域因素;第二个数字表示同一地域不同话题的影响力占比,即话题因素。

表5   地域因素、话题因素分布

Table 5  Distribution of Geographical Factors and Topic Factors

地域

话题类型
事件
进展
群众
意见
政府
回应
知识
科普
事后
措施
华北0.15/0.210.11/0.180.18/0.260.10/0.130.17/0.23
东北0.03/0.050.21/0.170.06/0.100.25/0.280.09/0.39
华东0.13/0.190.09/0.120.12/0.330.13/0.140.20/0.22
华中0.10/0.110.08/0.100.10/0.320.09/0.120.10/0.35
西南0.26/0.210.22/0.240.19/0.130.11/0.200.19/0.22
西北0.18/0.210.19/0.170.22/0.220.08/0.120.15/0.29
华南0.15/0.230.10/0.190.11/0.240.24/0.150.10/0.19

新窗口打开| 下载CSV


(2) 微博用户话题态度值计算

根据公式(11)计算每个话题下所有微博群体的情感强度均值并加权求和,结果如表6所示。

表6   微博用户话题态度值

Table 6  Topic Attitude Values of Microblogging Users

话题类型事件进展群众意见政府回应知识科普事后措施
p0.510.490.510.520.51

新窗口打开| 下载CSV


(3) 话题热度计算

根据公式(12),得到两起疫苗事件中每个话题的相对热度,如表7所示。

表7   两起疫苗事件中的话题热度

Table 7  The Salience of Topics in Two Vaccine Events

话题类型长春疫苗事件s1山东疫苗事件s2
事件进展0.330.26
群众意见0.480.50
政府回应0.100.16
知识科普0.060.05
事后措施0.030.03

新窗口打开| 下载CSV


4.3 事件进展性话题共振

事件进展型话题主要是与突发事件本身相关的客观信息,是推动舆情事件发展的主要线索,也是推动网络舆情演变的重要因素。结合表5-表7,事件进展相关微博的随机共振模型参数如表8所示,代入微博舆情话题随机共振模型、使用MATLAB仿真工具进行适当变换并仿真,结果如图2所示。

表8   事件进展型话题共振模型参数

Table 8  Resonance Model Parameters of Event Progress Topics

话题因素i地域因素r态度值p长生疫苗
话题热度s1
山东疫苗
话题热度s2
0.050.030.510.330.26

新窗口打开| 下载CSV


图2

图2   事件进展型话题共振结果

Fig.2   Resonance of Event Progress Topic


两起疫苗事件中的事件进展型话题发生了共振。由表4可以看出,每起事件中与事件进展相关的微博数量较多,此类话题的初始发布用户主要是政务微博和主流媒体,随后引起微博用户的广泛转发。此类话题初始发布用户的身份在一定程度上保障了信息的可靠性,其粉丝规模决定了相关信息的初始受众范围。在突发公共卫生事件中,由于信息不对称,网民往往处于劣势地位,被动地接受与事件进展相关的信息,因此一旦接收到以上两种用户发布的相关信息,在基本的信息需求得到满足的同时进行积极转发以扩大信息的传播范围,同时借助微博的转评功能表达自己的看法。由于话题类型的相似性,网民在相似情境下产生类似的情感态度,叠加历史事件相关话题的看法,产生共振。

4.4 群众意见型话题共振

群众意见型话题共振模型的参数和结果分别如表9图3所示。

表9   群众意见型话题共振模型参数

Table 9  Resonance Model Parameters of Public Opinion Topics

话题因素i地域因素r态度值p长生疫苗
话题热度s1
山东疫苗
话题热度s2
0.170.210.490.480.50

新窗口打开| 下载CSV


图3

图3   群众意见型话题共振结果

Fig.3   Resonance of Public Opinion Topics


群众意见型话题包含普通微博用户对政府提出的意见、对事件本身的看法、网民的自我表达等内容,是突发公共卫生事件中占据主要地位的话题类型。普通用户是微博用户基数最大的群体,身份背景最为复杂,对突发公共卫生事件的感知最为敏感,是推动舆情衍变的主要动力。突发公共卫生事件由于其危害的复杂性和严重性,关系到广大用户的生命安全与健康,所以突发公共卫生事件一旦爆发,网民首先考虑的是此事件对自身生命安全的威胁,因此表达出来的情绪往往是主观消极的,主要由悲伤、担忧、恐慌、愤怒等负面情绪构成。在主体关联和情绪关联的双重作用下,网民常常会对历史事件“旧事重提”,联想到自己曾经经历过的相似事件和情感波动,影响用户对当前事件的态度与看法,产生更加激烈的情绪反应,造成随机共振现象。

4.5 政府回应型话题共振

政府回应型微博一般指政府对网民意见的回应,包括对事件进展的回应、问题答疑、解决措施等内容,是政府部门在一定阶段针对舆情做出的反应。政府回应是政府应急管理的重要内容,对稳定网络舆情、网民情绪具有重要作用,其内容与方式将会显著影响网络舆情的演变。该话题共振模型的参数和结果分别如表10图4所示。

表10   政府回应型话题共振模型参数

Table 10  Resonance Model Parameters of Government Response Topics

话题因素i地域因素r态度值p长生疫苗话题
热度s1
山东疫苗话题
热度s2
0.100.060.510.100.16

新窗口打开| 下载CSV


图4

图4   政府回应型话题共振结果

Fig.4   Resonance of Government Response Topics


两个话题发生了共振。在两起疫苗事件中,政府回应的主要内容包括国家领导人对疫苗事件的批示、国际组织的关注、对网民疑问的释疑等内容。政府回应可以作为事件进展和网民意见的延续,此时关于事件进展的信息比较完备,网民对事实信息的获取需求转化为对相关话题的表达需求,因此政府回应型微博往往能引起网民情感的集体表达,形成情绪的累积效应,使舆情达到极大值。在这样的情况下,历史事件相关话题将会引起网民情感的叠加,形成共振,造成更加明显的情感表达。

4.6 知识科普及事后措施型话题共振

使用相同操作分别计算知识科普型和事后措施型的话题因素、地域因素、态度值、话题热度等参数,实验发现知识科普型话题和事后措施型话题没有发生共振。

突发公共卫生事件情境下,网民出于自身利益的考虑,急切需求相关专业知识以判断自己的身心健康是否被影响,从而产生不同的回应。在两起疫苗事件中,疫苗是主要的事件主体之一,影响的地域范围比较集中且广泛,与人民群众的健康息息相关,是网民最为敏感的话题之一。网民一般对疫苗缺乏专业知识,难以判断自己是否被相关事件所影响,所以相关的知识科普是网民的主要需求之一。网民根据获取的专业知识判断利益关系,从而针对性地做出回应。知识科普是突发公共卫生事件中不可缺少的信息类型,在一定程度上能够缓解网民的恐慌,避免引起网络集体行为事件。因此,突发公共事件爆发后,网民对专业知识的了解,叠加以往事件的知识积累,使网民具有较为理性的主观判断。但是由于此类信息在舆情事件中所占的比例较小,在每起事件中的热度较低,难以产生话题共振。

事后措施是政府针对突发公共卫生事件的结果做出的总结和预防措施,一般处于事件的平息阶段。此时由于社交媒体的即时性,旧的舆论热点被新的事件所覆盖,网民对突发公共卫生事件的注意力逐渐被转移,此事件被“阶段性”遗忘,所以此类话题的微博数量和相对热度较低。事后措施型话题在两起事件中的相对热度一致,包括的内容比较单一,在突发公共卫生事件中占比较低,随着舆情事件的沉寂热度变小,对当前事件相关话题的影响较小,因此难以产生共振。

5 结 语

随着近年来突发公共卫生事件的频发,多起事件的关联特征愈发明显,事件之间的作用也越来越显著,对网络舆情演变具有重要影响。以往研究主要关注单一事件网络舆情中的话题特征,忽略了多事件网络舆情的话题关系所导致的舆情变化。结合以往关于多事件网络舆情的理论研究,本文从定量的角度,使用基于非线性朗之万方程的随机共振模型,研究在多起突发公共卫生事件中相关话题之间的作用效果及其对整体舆情演变的影响,探索多事件网络舆情内容的相似性,发现网络舆情热度的影响因素,对政府应急管理具有一定参考价值。

本文存在以下不足:

(1)观察长生疫苗事件的微博语料发现,许多与事件相关的微博被删除,在朋友圈被广泛传播的热门文章也被删除,因此某些具有影响力的微博难以获取,一定程度上影响了话题热度的计算;

(2)两起疫苗事件在微博和微信朋友圈中间引起广泛热议,发生了话题和用户在平台之间的迁移,由于本文只抓取微博平台上的相关微博,对两起疫苗事件的网络舆情缺乏全面的认识,所研究的话题类型可能存在局限。

未来拟以多起突发公共卫生事件为例,分析多舆情网络事件的相关关系和话题特征,提取普遍存在的话题类型,分析相关话题之间的共振规律;从多个网络平台收集数据,全方位掌握网络舆情事件的整体特征,综合分析突发公共卫生事件话题的演变规律,探索多起相关事件中相关话题的共振现象,提高面向突发公共卫生事件话题的随机共振模型的适用性。

作者贡献声明:

梁艳平:设计研究方案,进行实验,起草论文;

安璐:提出研究思路,设计研究方案,修改论文;

刘静:修改论文。

利益冲突声明:

所有作者声明不存在利益冲突关系。

支撑数据:

支撑数据由作者自存储,E-mail: 827460499@qq.com。

[1] 梁艳平.weibo.xlsx.山东疫苗事件及长春疫苗事件新浪微博及行为数据.

[2] 梁艳平.Shandong_topic xlsx.山东疫苗事件话题及其表征词与话题概括.

[3] 梁艳平.Changchun_topic.xlsx.长春疫苗事件话题及其表征词与话题概括.

参考文献

刘志明, 刘鲁 .

面向突发事件的民众负面情绪生命周期模型

[J]. 管理工程学报, 2013,27(1):15-21.

[本文引用: 1]

( Liu Zhiming, Liu Lu .

Public Negative Emotion Model in Emergencies Based on Aging Theory

[J]. Journal of Industrial Engineering and Engineering Management, 2013,27(1):15-21.)

[本文引用: 1]

Surprenant A M .

Distinctiveness and Serial Position Effects in Tonal Sequences

[J]. Perception & Psychophysics, 2001,63(4):737-745.

[本文引用: 1]

Blei D M, Ng A Y, Jordan M I .

Latent Dirichlet Allocation

[J]. Journal of Machine Learning Research, 2003,3:993-1022.

[本文引用: 1]

邹鸿程 .

微博话题检测与追踪技术研究

[D]. 郑州:解放军信息工程大学, 2012.

[本文引用: 1]

( Zou Hongcheng .

Research on Microblog Topic Detection and Tracking

[D]. Zhengzhou: PLA Information Engineering University, 2012.)

[本文引用: 1]

Zheng L, Han K .

Multi Topic Distribution Model for Topic Discovery in Twitter

[C]// Proceedings of the 2013 IEEE 7th International Conference on Semantic Computing(ICSC), Irvine, CA, USA. IEEE, 2013: 420-425.

[本文引用: 1]

Mikolov T, Chen K, Corrado G , et al.

Efficient Estimation of Word Representations in Vector Space

[OL]. arXiv Preprint, arXiv: 1301.3781.

[本文引用: 1]

朱雪梅 .

基于Word2Vec主题提取的微博推荐

[D]. 北京:北京理工大学, 2014.

[本文引用: 1]

( Zhu Xuemei .

Micro-blog Recommendation Based on Word2Vec Topic Extraction

[D]. Beijing: Beijing Institute of Technology, 2014.)

[本文引用: 1]

缪广寒 .

基于Word2vec和SVM的微博情感挖掘与仿真分析

[J]. 电子科技, 2018,31(5):81-83.

[本文引用: 1]

( Miu Guanghan .

Emotion Mining and Simulation Analysis of Microblogging Based on Word2vec and SVM

[J]. Electronic Science and Technology, 2018,31(5):81-83.)

[本文引用: 1]

李心蕾, 王昊, 刘小敏 , .

面向微博短文本分类的文本向量化方法比较研究

[J]. 数据分析与知识发现, 2018,2(8):41-50.

[本文引用: 1]

( Li Xinlei, Wang Hao, Liu Xiaomin , et al.

Comparing Text Vector Generators for Weibo Short Text Classification

[J]. Data Analysis and Knowledge Discovery, 2018,2(8):41-50.)

[本文引用: 1]

孙江华, 张殊 .

现代传播: 中国传媒大学学报

[J].现代传播: 中国传媒大学学报, 2015(4):141-143.

[本文引用: 1]

( Sun Jianghua, Zhang Shu .

Research on the Influence of Traditional Newspaper Microblogs Based on Main Component Analysis and Cluster Analysis

[J]. Modern Communication: Journal of Communication University of China,2015(4):141-143.)

[本文引用: 1]

李情情, 鲁燃, 朱振方 , .

基于特定用户角色的热度计算方法及应用

[J]. 计算机工程与设计, 2016,37(5):1201-1207.

[本文引用: 1]

( Li Qingqing, Lu Ran, Zhu Zhenfang , et al.

Hot Calculation Method and Application Based on Particular User Roles

[J]. Computer Engineering and Design, 2016,37(5):1201-1207.)

[本文引用: 1]

赵文清, 侯小可 .

基于词共现图的中文微博新闻话题识别

[J]. 智能系统学报, 2012,7(5):444-449.

[本文引用: 1]

( Zhao Wenqing, Hou Xiaoke .

News Topic Recognition of Chinese Microblog Based on Word Co-occurrence Graph

[J]. CAAI Transactions on Intelligent Systems, 2012,7(5):444-449.)

[本文引用: 1]

王勇, 肖诗斌, 郭跇秀 , .

现代图书情报技术

[J].现代图书情报技术, 2013(2):57-62.

[本文引用: 1]

( Wang Yong, Xiao Shibin, Guo Yixiu , et al.

Research on Chinese Micro-blog Bursty Topics Detection

[J]. New Technology of Library and Information Service, 2013(2):57-62.)

[本文引用: 1]

谌志群, 徐宁, 王荣波 .

基于主题演化图的网络论坛热点跟踪

[J]. 情报科学, 2013,31(3):147-150.

[本文引用: 1]

( Chen Zhiqun, Xu Ning, Wang Rongbo .

BBS Hot Topic Tracking Based on Theme Evolution Graph

[J]. Information Science, 2013,31(3):147-150.)

[本文引用: 1]

高继平, 丁堃, 潘云涛 , .

多词共现分析方法的实现及其在研究热点识别中的应用

[J]. 图书情报工作, 2014,58(24):80-85,98.

[本文引用: 1]

( Gao Jiping, Ding Kun, Pan Yuntao , et al.

Implementation of Multiple Words Co-occurrence Analysis and Its Application in the Recognition of Research Hotspots

[J]. Library and Information Service, 2014,58(24):80-85,98.)

[本文引用: 1]

Menjo T, Yoshikawa M .

Trend Prediction in Social Bookmark Service of Bookmark

[C]// Proceedings of the 19th International Conference on the World Wide Web. ACM, 2010.

[本文引用: 1]

Nikolov S .

Trend or No Trend: A Novel Nonparametric Method for Classifying Time Series

[D]. Massacysetts Institute of Technology, 2012.

[本文引用: 1]

Bandari R, Asur S, Huberman B A .

The Pulse of News in Social Media: Forecasting Popularity

[C]// Proceedings of the 6th International AAAI Conference on Weblogs & Social Media. 2012.

[本文引用: 1]

方付建, 肖林, 王国华 .

网络舆情热点事件“系列化呈现”问题研究

[J]. 情报杂志, 2011,30(2):1-5.

[本文引用: 1]

( Fang Fujian, Xiao Lin, Wang Guohua .

Research on Consecutive Hot Events of Network Public Opinion

[J]. Journal of Intelligence, 2011,30(2):1-5.)

[本文引用: 1]

兰月新 .

现代图书情报技术

[J].现代图书情报技术, 2013(3):51-57.

[本文引用: 1]

( Lan Yuexin .

Research on Monitoring Model of Public Opinion Derived for Network Emergencies

[J]. New Technology of Library and Information Service,2013(3):51-57.)

[本文引用: 1]

高承实, 陈越, 荣星 , .

网络舆情几个基本问题的探讨

[J]. 情报杂志, 2011,30(11):52-56.

[本文引用: 1]

( Gao Chengshi, Chen Yue, Rong Xing , et al.

Some Basic Problems on Network Opinion Research

[J]. Journal of Intelligence, 2011,30(11):52-56.)

[本文引用: 1]

姜胜洪 .

理论月刊

[J].理论月刊, 2008(4):34-36.

[本文引用: 1]

( Jiang Shenghong .

The Formation and Development of the Hot Spots of Network Public Opinion, the Status Quo and the Guidance of Public Opinion

[J]. Theory Monthly,2008(4):34-36.)

[本文引用: 1]

郭小安 .

现代传播: 中国传媒大学学报

[J].现代传播: 中国传媒大学学报, 2015(3):123-130.

[本文引用: 1]

( Guo Xiaoan .

The Basic Mode and Reflection of the Network Public Opinion Association Overlay: A Comprehensive Analysis Based on Relevant Cases

[J]. Modern Communication: Journal of Communication University of China,2015(3):123-130.)

[本文引用: 1]

王国华, 邓海峰, 王雅蕾 , .

网络热点事件中的舆情关联问题研究

[J]. 情报杂志, 2012,31(7):1-5.

[本文引用: 1]

( Wang Guohua, Deng Haifeng, Wang Yalei , et al.

A Study on Public Opinion Relevancy of Network Hot Issues

[J]. Journal of Intelligence, 2012,31(7):1-5.)

[本文引用: 1]

MATLAB [EB/OL]. [2019-08-07].https://www.mathworks.com/.

URL     [本文引用: 1]

张玉强 .

网络舆情危机的政府适度反应研究

[D]. 北京:中央民族大学, 2011.

[本文引用: 1]

( Zhang Yuqiang .

Study on the Government’s Moderate Response to the Crisis of Network Public Opinion

[D]. Beijing: Minzu University of China, 2011.)

[本文引用: 1]

杜诗雨, 齐佳音 .

基于主成分分析的微博话题影响指数评价研究

[J]. 情报杂志, 2014,33(5):129-135.

[本文引用: 1]

( Du Shiyu, Qi Jiayin .

Research on the Evaluation of Microblog Topic Influence Index Based on PCA Methods

[J]. Journal of Intelligence, 2014,33(5):129-135.)

[本文引用: 1]

Benzi R, Sutera A, Vulpiani A .

Journal of Physics A: Mathematical and General

[J]. Journal of Physics A: Mathematical and General, 1981(14):L453-L457.

[本文引用: 1]

Benzi R, Parisi G, Sutera A , et al.

Theory of Stochastic Resonance in Climatic Change

[J]. SIAM Journal on Applied Mathematics, 1983,43(3):565-578.

[本文引用: 1]

Langevin P .

Sur La Théorie Du Mouvement Brownien

[J]. Comptes Rendus de l’Académie des Sciences, 1908,146:530-533.

[本文引用: 2]

R 语言 LDA 可视化包 LDAvis[EB/OL].[2019-08-07].https://github.com/cpsievert/LDAvis.

URL     [本文引用: 2]

( A LDA Visualization Package in R[EB/OL].[2019-08-07].https://github.com/cpsievert/LDAvis.)

URL     [本文引用: 2]

Sievert C, Shirley K E .

LDAvis: A Method for Visualizing and Interpreting Topics

[C]// Proceedings of the Workshop on Interactive Language Learning, Visualization, and Interfaces. 2014.

[本文引用: 1]

肖挺, 刘华 .

服务业生产效率异质性对城乡收入差距影响研究

[J]. 管理科学, 2013,26(4):103-112.

[本文引用: 1]

( Xiao Ting, Liu Hua .

Empirical Study on the Impacts of Productivity Heterogeneity in Chinese Service Industry on the Urban-rural Income Gap

[J]. Journal of Management Science, 2013,26(4):103-112.)

[本文引用: 1]

BosonNLP[EB/OL].[2019-08-07].https://bosonnlp.com/.

URL     [本文引用: 1]

廖瑞丹 .

基于随机共振模型的网络舆情共振现象研究

[D]. 南京:南京理工大学, 2017.

[本文引用: 1]

( Liao Ruidan .

Study on Network Public Opinion Resonance Based on Stochastic Resonance Model

[D]. Nanjing: Nanjing University of Science & Technology, 2017.)

[本文引用: 1]

李倩倩, 黄远, 姜景 , .

中国网络社会治理的舆论指数

[J]. 中国科学院院刊, 2015,30(1):90-96.

[本文引用: 1]

( Li Qianqian, Huang Yuan, Jiang Jing , et al.

Opinion Index of Social Governance on Chinese Network

[J]. Bulletin of the Chinese Academy of Sciences, 2015,30(1):90-96.)

[本文引用: 1]

中国应急服务网[EB/OL].(2016-01-01). [2019-05-01]. http://www.52safety.com/yjsgzh/index.jhtml.

URL     [本文引用: 1]

(China Emergency Services Platform[EB/OL].(2016-01-01). [2019-05-01]. http://www.52safety.com/yjsgzh/index.jhtml.)

URL     [本文引用: 1]

Qu Y, Wu P F, Wang X .

Online Community Response to Major Disaster: A Study of Tianya Forum in the 2008 Sichuan Earthquake

[C]// Proceedings of the 42nd Hawaii International Conference on System Sciences. 2009.

[本文引用: 1]

Qu Y, Huang C, Zhang P , et al.

Microblogging After a Major Disaster in China: A Case Study of the 2010 Yushu Earthquake

[C]// Proceedings of the ACM 2011 Conference on Computer Supported Cooperative Work, Hangzhou, China. DBLP, 2011: 25-34.

[本文引用: 1]

/

版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn