据CNNIC发布的《第31次中国互联网络发展状况统计报告》, 截至2012年12月底, 我国网民规模达5.64亿, 全年共计新增网民5 090万人, 互联网普及率为42.1%[ 1]。某个突发事件信息在网络发布后, 网络舆情的产生已经不可避免。但是, 由于网络信息的开放式、网络式传播, 极易发生信息异化现象, 产生由原始舆情衍生的新舆情, 这将造成网络舆情对社会的“二次影响”。所以, 突发事件衍生舆情监测问题成为网络舆情治理的重要内容。
国内外学者已有对突发事件衍生舆情及其相关内容的研究, 但是直接研究网络衍生舆情的相对较少, 而研究具体衍生舆情, 如伪舆情、网络谣言等的文献则相对较多。喻发胜等[ 2]基于传播学的视角探讨网络传播的衍生效应与网络舆论生成及演变的关系, 在研究传播技术特征与传播人际特征的基础上, 产生了“意见领袖作用凸显”、“信息控制力弱化”、“舆论场加速形成”、“议程设置全民化”等一系列衍生效应; 王国华等[ 3]研究了舆情聚焦、舆情发散、舆情动员、舆情变换等4种类型带来的突发事件网络舆情衍生效应以及突发事件舆情衍生效应出现的影响因素; 朱恒民等[ 4]考虑微博的传播特性以及舆情话题的衍生性等因素, 参考传染病模型, 建立了舆情传播的SIRS模型, 有效地揭示出微博用户关注关系所形成的复杂网络中舆情传播演化的机理; Zanette[ 5]、Moreno等[ 6]以
及Zhou等[ 7]研究了谣言在复杂网络中的传播演化过程; Lu等[ 8]则对信息在复杂网络中的传播过程进行探讨, 谣言与信息类似, 它们在传播过程中内容不会发生改变, 而舆情的传播过程不同, 其话题具有较强的衍生性, 个体对舆情的某一话题免疫 (R) , 但却可能制造新话题 (I) 。本文在研究网络衍生舆情传播特点的基础上, 建立网络舆情传播规律的微分方程模型, 通过数值仿真研究网络舆情的衍生特点, 以期为后续研究和政府应对网络舆情提供思路。
衍生, 是自然界与人类社会十分普遍而又复杂的现象。语词上, 衍生指演变而产生, 从母体物质得到的新物质。而衍生舆情, 指的是由原事件网络舆情演变而产生的新的舆情, 衍生舆情和原始舆情交织在一起, 共同形成突发事件网络舆情。衍生舆情的影响程度如图1所示:
.可以看出, 衍生舆情将会带来继原始舆情高潮后的另一个舆情影响高潮, 对社会造成二次影响, 如果没有及时进行监测、采取引导措施, 衍生舆情和原始舆情交织在一起, 网络舆情将会造成比突发事件本身更大的影响。
网络舆情是由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合, 所以, 网络舆情是包含大量信息数据的集合。网民发表认知、态度、情感和行为倾向的看法时, 必定导致信息数据的变化, 通过网络舆情数据变化可以监测跟踪网络舆情的变化。所以, 从研究网络舆情数据变化程度的角度出发, 可以监测衍生舆情的变化趋势, 如图2所示。
.及其衍生舆情可行性.
以“舟曲泥石流”事件[ 9]网络舆情统计数据为例, 统计数据如图3所示。
.事件舆情开始于2010年8月7日, 8月10日达到舆情高潮, 此后4天舆情平缓下降。而在8月14日后, 舆情没有按舆情传播规律 (图3中黑色虚线) 继续下降, 而是急转上升, 到8月16日形成衍生舆情高潮点, 此后舆情才趋于平缓。究其原因是:8月7日-8月13日, 舆情主要集中于灾情进展、救灾物资、救援情况方面[ 9]; 而8月14日-8月22日, 中国经济新闻网讯的一篇“舟曲特大泥石流成因调查”通过实地调查得出泥石流成因为地方政府生态破坏、预警漏洞方面[ 10], 这篇文章被大量转载, 舆情热度持续到22日, 由灾情舆情衍生出的人祸舆情成为事件舆情传播后期的主题。这一点与舆情数据变化是吻合的, 所以通过网络舆情数据变化建立数学模型可以及时监测衍生舆情的发生、发展情况。
首先, 通过数学建模研究网络舆情传播的一般规律, 确定舆情传播的各个阶段 (此处研究与作者前期研究[ 11]相近, 但建模变量有所区别) ; 其次, 构建虚拟网络舆情传播过程, 然后加入衍生舆情数据, 通过数值仿真研究不同舆情传播阶段舆情衍生的规律; 最后, 根据网络舆情衍生程度制定预警级别。目前, 研究具体衍生舆情如伪舆情、网络谣言等的文献相对较多, 而缺乏对网络衍生舆情一般规律的研究, 本文通过数值仿真研究网络舆情的衍生规律进而制定预警级别, 可以为政府网络衍生舆情监测提供参考。
描述突发事件网络舆情传播规律的变量有很多, 例如微博发文量、新闻发文量、新闻词频、点击数量、回复数量等, 每个变量都可以反映网络舆情的传播程度。本文选取新闻词频作为建模变量研究突发事件网络舆情传播规律。注意:建模变量数据和统计数据要做区分, 建模变量数据是在统计数据基础上进行累加[ 11]生成的数据列。
假设某突发事件发生后, 关于该事件的网络新闻词频累计数量是关于时间的连续可微函数, 即f=f (t) , 网络新闻词频累计数量初值 (t=0时) 为f0, 网络新闻词频累计数量上限为K。网络新闻词频累计数量的变化量与累计数量本身f、网络剩余空间 (1-fK) 成正比[ 12], 即:
dfdt=rf (1-fK) .
其中, r> 0表示最大增长率 (定值) 。求解微分方程得:
f (t) =K1+ (Kf0-1) e-rt.
可以看出, K和r是待定参数, 网络舆情传播规律的实质就是通过历史数据确定参数K和r。通过计算f′′ (t) =0及f′′′ (t) =0可以确定传播模型的三个关键时间点t0, t1, t2, 将整个时间区间分为4个时段, 每个时段对应网络舆情的发展阶段[ 12], 舆情总体趋势为“S”形, 且曲线拐点P为舆情影响高潮点, 如图4所示。根据三个关键时间点和4个舆情发展阶段, 政府就可以进行网络舆情分析与预测, 实现政府对网络舆情的预警。
.为了更好地说明网络舆情衍生规律, 本文通过数值仿真研究衍生特点。假设某个突发事件网络舆情传播规律为:
f (t) =1001+99e-0.5t.
其中, r=0.5, K=100。
舆情传播数据如表1所示:
假设其衍生舆情传播规律模型为:
g (t) =501+49e-0.3t.
其中, r1=0.3, K1=50。
按时间先后, 衍生舆情可以发生在原始舆情的潜伏期、传播期或消退期, 为详尽描述衍生特点, 本文在原始舆情数据基础上逐点加入衍生舆情数据, 即分别在n=t, t=0, 1, 2, 3, …时, 取原始舆情数据与衍生舆情数据的和值作为综合舆情数据进行分析, 例如在n=5时产生衍生舆情的综合舆情数据如表2所示:
(1) 潜伏期衍生舆情传播.
原始舆情的潜伏期为[0, t1]=[0, 6.6], 则分别在n=0, 1, 2, 3, 4, 5, 6处绘制综合舆情变化趋势, 如图5所示。
.可以看出, 综合舆情的饱和状态为K+K1=150 (需要时间为28天左右) , 总体变化趋势接近“S”形。在原始舆情潜伏期和扩散期, 舆情衍生对数据影响较小, 而在消退期, 舆情衍生对数据影响明显。对于统计数据来说, 衍生特点为原始舆情高潮点明显升高、消退期舆情下降趋势减缓, 如图6所示。
.(2) 传播期衍生舆情传播.
原始舆情的传播期为[t1, t2]=[6.6, 11.8], 则分别在n=7, 8, 9, 10, 11处绘制综合舆情变化趋势, 如图7所示:
.综合舆情的饱和状态为K+K1=150 (需要时间为35天左右) , 总体变化趋势接近“双S”形。在原始舆情潜伏期和扩散期, 舆情衍生对数据影响非常小, 而在消退期, 舆情衍生对数据影响明显。对于舆情统计数据, 衍生特点为原始舆情高潮点少许升高、消退期出现衍生舆情高潮点, 且随着n的增大, 衍生舆情高潮点逐渐升高, 如图8所示。
.(3) 消退期衍生舆情传播.
原始舆情的传播期为[t1, +∞]=[11.8, +∞], 分别在n=12, 13, …, 20处绘制综合舆情变化趋势, 如图9所示:
.综合舆情的饱和状态为K+K1=150 (需要时间为43天左右) , 总体变化趋势呈现明显“双S”形。在原始舆情潜伏期和扩散期, 舆情衍生对数据没有影响, 而在消退期, 舆情衍生对数据影响明显, 呈现明显“S”形。对于舆情统计数据, 衍生特点为原始舆情高潮点没有变化、消退期出现明显衍生舆情高潮点, 且随着n的增大, 衍生舆情高潮点逐渐升高, 如图10所示:
.综合潜伏期、传播期、消退期舆情衍生特点可以发现, 在舆情潜伏期, 舆情数据波动不大。因此为进行突发事件衍生舆情预警, 本文利用舆情潜伏期数据进行数据建模, 预测舆情高潮点, 然后将新产生的统计数据与预测数据进行运算, 进而确定预警级别。
令预测数据差分[ 13]为列:h0, h1, h2, …, hn, …, 统计数据为g0, g1, g2, …, gn, …。衍生率表示统计数据超出原始舆情峰值的百分比, 定义:
Δi=gi-hifmax×100%.
当Δi< 20% (包含负比值) 时默认是正常数据波动, 当Δi≥20%时进行衍生舆情预警, 预警级别如表3所示。根据衍生率Δi的变化可以及时监测网络衍生舆情的变化趋势。
应用舆情潜伏期数据 (真实数据) 进行数据建模, 得出网络舆情传播规律模型, 然后根据模型进行数据预测, 再由预测数据 (图12中虚线) 与真实数据 (图12中折线) 逐点计算衍生率, 根据衍生率变化程度判别舆情衍生情况, 最后进行衍生舆情预警并制定预警级别。
.选取潜伏期前7个数据进行建模, 通过MATLAB拟合数据, 得出网络舆情传播规律模型为:
f (t) =65021+162×exp (-0.85t) .
其中, 预测数据高潮点为1 316。
根据预测模型计算衍生率Δi及对应预警情况如表4所示。根据衍生率的变化可以确定衍生舆情高潮点及衍生点。
通过监测结果发现:衍生舆情高潮点5个, 衍生点9个, 其中高潮点对应时间为2月17日、2月20日、2月23日、2月27日和3月5日。通过衍生率的变化可以及时监测衍生趋势、预测衍生点和高潮点, 具体导致衍生舆情的起因及对应预警级别如表5所示:
经过近几年舆情事件的冲击, 无论理论研究还是政府应对策略都有较大的进步, 但由于网民发表言论的自由、平等、交互、实时、匿名等特点, 使得突发事件网络舆情发生后极易产生衍生舆情, 进而形成不同规模的网络舆情危机, 因此, 及时监测衍生舆情并预警是政府网络舆情管理的重要研究内容。本文在研究网络舆情衍生特点的基础上, 建立微分方程模型研究网络舆情传播的一般规律, 应用数值仿真研究舆情衍生规律, 并通过监测衍生率的变化实现衍生舆情预警, 以期为政府应对网络舆情提供参考。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|