微博网络中信息的“裂变式”传播模式对已有舆情传播模型提出挑战。为有效地揭示出微博用户关注关系所形成的复杂网络中舆情传播演化的机理,以有向无标度网络为载体提出舆情传播的SIRS模型,该模型综合考虑微博的传播特性以及舆情话题的衍生性等因素,并对模型进行仿真分析,其结果可以验证模型的有效性。
Fission mode of information transmission in the micro-blog network presents a challenge to the existing public opinion propagation model. In order to depict the mechanism of the public opinion transmission in the complex network formed by users’ attention relationship in micro-blog, the paper proposes an SIRS model of public opinion propagation based on the directed BA network.The model considers the propagation characteristics of micro-blog, and derivatives of public opinion topics and other factors comprehensively.The simulation results can verify the validity of the model.
目前,微博以“碎片化”的信息形式[ 1]渗入到人们生活的方方面面,逐渐成为舆情发生的重要阵地。微博用户之间的关注关系与好友关系影响了舆情传播的方向,同时其裂变式传播[ 2]特性影响了舆情传播的速度与传播范围。为了阐明微博用户关注关系网络中舆情话题传播演化的机理,本文以有向无标度网络为研究载体,提出了舆情传播演化的SIRS模型,该模型认为舆情话题在传播过程中存在衍生行为。结合微博传播特性,本文对该模型进行仿真,并对结果进行了分析。
关于微博传播网络的拓扑结构研究已逐渐展开。夏雨禾[ 3]基于新浪微博的数据研究了微博互动的结构与机制,认为“关注模式”是微博互动的重要方式,“被关注者”与“关注者”实际是“传播者”与“接收者”的角色关系,这导致网络分布的非均衡性;王晓光等利用中心性理论对微博社区结构进行实证分析,认为关注关系的形成与用户的入度有关,入度越大的个体,影响力越强[ 4, 5];刘志明等[ 6]研究微博网络中被关注者的粉丝数分布,发现该分布具有明显的胖尾特性,服从幂律分布。因此,以微博用户为节点,以关注关系为边,微博网络可被看作是一个服从幂律分布的复杂网络。
关于舆情在复杂网络中传播的动力学行为研究还比较少,相关研究认为舆情传播演化模型也服从病毒传播的SIR模型。李翔等[ 7]提出病毒的流行、谣言的散布都是在不同网络中的传播现象,存在共通的演化机理,在舆论传播模型中,S、I、R分别表示不知道消息的人、知道消息并传播的人、知道消息但已经失去传播能力或者兴趣的人[ 8, 9]。Zanette[ 10]、Moreno[ 11]以及Zhou等[ 12]研究了谣言在复杂网络中的传播演化过程。Lu等[ 13]则对信息在复杂网络中的传播过程进行探讨,谣言与信息类似,它们在传播过程中内容不会发生改变,而舆情的传播过程不同,其话题具有较强的衍生性,个体对舆情的某一话题免疫(R),但却可能制造新话题(I)。因此,传统的SIR模型已不适用于描述舆情的传播过程。
综上可知,基于用户关注关系所形成的微博网络是一种有向的复杂网络,另外,现有SIR模型并没有考虑微博网络中信息的“裂变式”传播特性以及舆情话题的衍生性等因素,不适合用来描述微博网络中舆情的传播过程。为了能够揭示出微博网络中舆情传播的内在机理,本文基于有向BA网络提出具有直接免疫效应的舆情传播SIRS模型,该模型认为当舆情事件衍生出新话题时,个体由免疫态转变为传播态的概率与社会影响以及个体接收到舆情信息的次数有关。
互联网是一种连接度分布函数具有幂律形式的复杂网络,且网络节点的连接度没有明显的特征长度,具有无标度性。为了解释幂律分布的产生机理,Barabási等[ 14]提出一个无标度网络模型,被称为BA模型。该模型考虑到实际网络具有两个重要特性:增长特性,网络的规模是不断扩大的;优先连接特性,新节点更倾向于与那些具有更高连接度的“大”节点相连接。基于网络的增长和优先连接特性,BA无标度网络模型的构造算法如下:
(1)增长:从一个具有m0个节点的网络开始,每次引入一个新的节点,并且连接到m个已存在的节点上,这里m≤m0。
(2)择优连接:一个新节点与一个已存在的节点i相连接的概率∏i与节点i的度ki、节点j的度kj之间满足的关系是:∏i=
经过t时间间隔后,该算法程序产生一个具有N=t+m0个节点、mt条边的BA网络。
在SIRS传播模型中,系统中的个体被划分为三类,即易感状态(S)、感染状态(I)、免疫状态(R)。在演化过程中,易感状态个体被感染,感染状态的个体获得免疫能力,而处于免疫状态的个体在获得免疫的同时以概率或者其他作用结果失去免疫力,从而变为易感状态。SIRS模型的状态转移过程如图1所示:
在微博网络中,用户拥有“关注者”与“被关注者”两种角色,用户B关注用户A,说明用户A是“被关注者”,用户B是“关注者”。当A发布信息时,该信息由A传播给B;当B发布信息时,该信息不会传播给A。因此,用户关注关系指明了信息的传播方向,基于用户关注关系形成的网络应是一个有向网络。微博用户的关注关系如图2所示:
以传统BA网络模型构建为基础,统计网络中各节点的入度与出度,每次新加入的节点,根据已有节点的入度进行择优连接,从而建立有向无标度网络。
该模型有三个基本假设:
(1)网络中的用户无新增或移除情况,即模型所构建网络为静态网络;
(2)在微博中,某个舆情所产生的衍生话题数不可估量,假设如果个体对舆情感兴趣,则在演化过程中该个体会重复传播该事件的相关话题;
(3)某用户发表关于舆情的微博信息后,其关注者均能获知该信息。
基于关注关系所形成的微博网络是一个有向的、服从幂律分布的复杂网络,网络中的个体根据是否传播舆情某话题信息分为三种状态:未接收到舆情某话题信息(S)、接收到某话题信息并进行传播或者制造新话题(I)、接收到某话题信息对该信息不感兴趣(R)。三者之间的转移过程如图3所示:
可以看出,微博网络中某个体发布舆情信息后,其邻居个体均接收到此信息,并以p概率由S态转化为I态,以1-p概率转化为R态;当该个体的所有邻居节点均被传播或者该个体为叶子节点,则以1概率转变为R态;而处于R态的个体将以概率p1转变为I态,成为衍生话题的传播者;或者以p2概率转变为S态,成为衍生话题的接收者。其中p1=(λ-q)+q[ 13],rtime为截止t时刻用户收到的关于舆情的信息次数,λ为个体对所接收到的话题不感兴趣但产生新话题的概率,q为衍生话题产生的最大概率,b体现了社会作用程度,b越大,社会作用越大,且p1+p2<1。
实验所统计的R值是指接收到该舆情话题的用户数量。
刘志明等[ 6]使用真实数据对微博网络结构进行分析,说明微博网络结构与BA网络结构性质相符,均具有幂律分布的特性,所以本文使用模拟数据构建模型的初始BA网络。
以微博网络的用户为节点,以用户之间的关注关系为边,构建符合微博关注网络结构的有向无标度网络。以m0=3,m=2,N=1 000构建网络,部分节点的入度与出度情况如表1所示:
![]() | 表1 部分节点度分布情况以及网络平均度(N=1 000) |
由表1可知,各节点的入度不等于出度,说明所构建的网络不是无向的而是平均度≈2的有向网络。为了验证网络结构的幂律性,其入度分布如图4所示:
可见,网络中节点的入度分布具有幂律特性,大部分节点的入度较小,即微博网络中的草根节点;而少部分的节点拥有较大的入度,即网络中的名微博用户,模型所构建网络结构符合现实情况。在此网络结构的基础上,根据上述状态转移规则构建舆情传播模型,并进行相关因素分析。
没有衍生话题产生的情况,即参数p1=0,当t时刻个体对前一舆情话题处于免疫状态时,则t+1时刻该个体以p2概率变为对新话题感兴趣的易感态;有话题产生(p1≠0)的情况,设置其余参数p=0.3,p2=0.2。实验结果如图5所示:
相对于未发生衍生的情况而言,话题发生衍生时系统达到稳定状态所需的时间更长,且稳定时R的比值受到影响。这表现在现实微博网络中是合理的,一个舆情事件一旦产生衍生话题,则该事件的传播时间更长,同时也影响网络中接收到该舆情信息的用户数。
为了研究衍生话题产生的情况下系统的传播规律,实验分析了模型中各参数对传播过程的影响。
由上述传播状态转移规则可知,传播率p、社会影响程度b以及免疫退化概率p2间接影响舆情衍生话题的产生情况。为了阐明随着时间变化,各因素对舆情传播演化过程的影响程度,本文使用定量分析方法进行实验分析,结果如图6所示:
以p=0.3,b=0.2,p2=0.2为基准,当p增大为0.6时,与传播个体相连的易感个体变为传播态的概率增加,网络中传播者增加,系统稳定时,网络中获知该舆情的个体增多,但是由于话题制造者未发生改变,所以传播的趋势未发生变化,系统到达稳定状态的时间不受影响;当b增大为1,即社会影响度增加,则网络中话题的制造者增多,传播速度加快,舆情较快到达稳定,稳定时接收到舆情信息的个体数增加幅度较大;由于q决定p1的最大取值,实验中设置q+p2=1,当p2增大为0.5时,p1变小,即个体第一次接收到舆情信息便产生衍生话题的概率变小,系统较快达到稳定状态,且稳定时R值减小。这是因为网络中更多的个体变为话题的接收者而非制造者,舆情传播时间变短,传播范围变小;但是当p2<1-q时,p2并不影响最终到达稳定状态的R值。
由模型可知,λ表示个体第一次接收到舆情信息则制造衍生话题的概率,λ 值越大,系统所产生的衍生话题越快而且越多,系统越难以稳定。为了考察λ对传播过程的影响,实验分析了λ对系统稳定状态下R值以及对系统弛豫时间的影响。设置p=0.4,q=0.8,b=0.8,p2=0.2,λ 为从0到1、以0.1为间距的取值,每次传播演化100时步,传播100次取其平均值,实验结果如图7和图8所示:
由图7可知,随着λ的增大,系统稳定时网络中R值逐渐增大,且在 λ=0.8时,演化达到饱和状态,稳定值不发生变化。结合图8,系统驰豫时间在λ=0.3时达到最大值,而当 λ>0.3时,网络中稳定状态的R值增大但驰豫时间变小,即网络传播速度加快,这与图6中当社会影响增大时,网络传播速度加快具有同样的影响机制。在现实微博网络中,一个舆情事件所产生的衍生话题越多,舆情发展拥有的激活节点数越多,传播范围扩大,从而网络中接收到舆情信息的用户越多,以致影响网络最终稳定状态的R值;但是当网络中大部分节点均为话题制造者时,网络演化到达稳定状态的时间变小,传播速度变快,由以上分析可知,本文所构建的模型符合现实情况。
基于对微博网络传播特性的分析,本文提出基于有向BA网络的舆情传播演化的SIRS模型,该模型综合考虑微博中信息传播的裂变性、舆情话题的衍生性等特点、社会媒体以及个体记忆等因素,并通过实验验证衍生话题对舆情传播过程的影响,结果发现衍生话题的产生影响系统到达稳定状态的时间以及最终网络中接收到舆情信息的用户数,且社会影响越大,传播越快,传播范围越广。传播率则影响传播范围而未影响传播演化的趋势。但是本文所构建的模型对现实情况进行了一定的简化,且模型所使用的数据均为模拟数据,这是本文的不足之处。
微博中舆情的传播演化研究有利于政府以及相关部门正确使用微博进行相关政策的传播,及时处理影响网络环境以及社会制度的信息传播,同时对更好地发挥意见领袖的作用具有重要意义。完善传播模型,并抓取现实网络数据对模型进行实证检验将是未来研究的重点内容。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|