现代图书情报技术  2016 , 32 (7): 70-77 https://doi.org/10.11925/infotech.1003-3513.2016.07.09

Orginal Article

基于复杂网络的虚拟社区创新知识传播机制研究*

叶腾1, 韩丽川1, 邢春晓23, 张妍23

1上海交通大学安泰经济与管理学院 上海 200030
2清华大学信息技术研究院 北京 100084
3清华信息科学与技术国家实验室 北京 100084

Knowledge Dissemination Mechanism in Virtual Communities: Case Study Based on Complex Network Theory

Ye Teng1, Han Lichuan1, Xing Chunxiao23, Zhang Yan23

1Antai College of Economics and Management, Shanghai JiaoTong University, Shanghai 200030, China
2Research Institute of Information Technology, Tsinghua University, Beijing 100084, China
3Tsinghua National Laboratory for Information Science and Technology, Tsinghua University, Beijing 100084, China

中图分类号:  G206.3 G350

通讯作者:  叶腾, ORCID: 0000-0001-9272-015X, E-mail: zxhui0@163.com

收稿日期: 2016-02-29

修回日期:  2016-04-22

网络出版日期:  2016-08-25

版权声明:  2016 《现代图书情报技术》编辑部 《现代图书情报技术》编辑部

基金资助:  *本文系国家863计划“心血管疾病大数据平台的构建和应用研究”(项目编号: SS2015AA020102)的研究成果之一

展开

摘要

目的】通过构建知识传播理论模型, 探究虚拟社区中知识传播效果的内在影响机制。【方法】基于虚拟社区GitHub的实际数据, 利用社会网络分析法和回归分析法, 实证研究社区成员的位置特性、区域特性和创新认可度对知识传播速度和传播范围的影响。【结果】位置中心性通过改变潜在受众数量影响知识传播范围。创新认可度通过影响传播概率影响知识传播速度。区域密集度与知识传播速度和传播范围呈负相关关系。【局限】研究结果仅基于一个大型虚拟社区, 结论的普遍性有待进一步证实。【结论】对虚拟社区的管理策略以及创新成员在虚拟社区中的知识分享策略和创新策略提出建议。

关键词: 合作创新 ; 复杂网络 ; 虚拟社区 ; 知识传播

Abstract

[Objective] This paper studies the mechanism of knowledge dissemination in virutal communities with the help of a new theoretical model. [Methods] First, we collected data from the virtual community GitHub. Second, we examined these data with social network and regression analysis techniques. Finally, we explored the influence of community member’s online position, physical location as well as attitude towards innovation to the knowledge dissemination speed and scope. [Results] We found that the number of online community members could change the scope of knowledge dissemination. The attitude towards innovation could affect the knowledge dissemination speed. The clustering extent posed negative effects to the knowledge dissemination scope and speed. [Limitations] This study was based on one virtual community. More research is needed to generalize the findings. [Conclusions] This study provides some strategical suggestion to virtual community management as well as members’ knowledge sharing and innovation activities.

Keywords: Collaborative innovation ; Complex network ; Virtual communities ; Knowledge dissemination

0

PDF (588KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

叶腾, 韩丽川, 邢春晓, 张妍. 基于复杂网络的虚拟社区创新知识传播机制研究*[J]. , 2016, 32(7): 70-77 https://doi.org/10.11925/infotech.1003-3513.2016.07.09

Ye Teng, Han Lichuan, Xing Chunxiao, Zhang Yan. Knowledge Dissemination Mechanism in Virtual Communities: Case Study Based on Complex Network Theory[J]. 现代图书情报技术, 2016, 32(7): 70-77 https://doi.org/10.11925/infotech.1003-3513.2016.07.09

1 引 言

创新是新技术的研究、开发、生产到首次实现商业化全过程的经济活动, 是企业乃至国家核心竞争力的主要来源。日趋激烈的市场竞争和快速变化的市场需求要求多元化的创新主体在创新过程中协同完成复杂的创新, 创新应该是开放式的, 合作创新成为非常重要的创新模式。

随着互联网和计算机技术的快速发展, 网络上涌现出大量具有软件开发和项目开发功能的虚拟社区, 如开源社区Linux、开源中国社区等。虚拟社区是基于信息网络和计算机技术并由拥有共同兴趣及需求的成员组成的, 成员可以分散在不同地区, 通过在线方式传播和扩散创新知识。虚拟社区是合作创新的主要力量, 获取、传播和创造知识成为维系社区参与度的主要原因, 创新知识的传播也成为影响虚拟社区创新绩效的关键因素, 研究创新知识的传播机制对虚拟社区的成功和发展具有重要意义。

虚拟社区中成员间的关系可以看作一种知识型社会网络, 一种由大量的知识传播者与知识接收者之间建立的、有向的、动态的、复杂的知识网络。随着互联网和计算机技术的发展, 网络数据便捷的存储和获取为大规模复杂网络的实证研究提供了便利条件, 如博客[1]、社交媒体[2-3]、航空交通[4]。社会网络作为一种复杂网络, 其度分布通常符合幂律形式(Power-Law)[5-9], 并且具有社区结构(Community Structure)[1, 10]。网络的结构可以决定网络的功能[11], 如信息传递功能[12]、社交功能[2]等, 社会网络的结构属性也影响动态传播过程。本文基于社交编程和代码托管社区GitHub中的大量真实数据, 从复杂网络的视角, 将静态网络性质和动态传播模型相结合, 建立创新知识传播的理论模型, 实证探索虚拟社区中创新知识传播的动态机制。

2 相关研究

虚拟社区中创新知识的传播研究已经引起了学者们的广泛关注, 越来越多的研究也开始从复杂网络的视角研究虚拟社区中的知识传播问题。这些研究主要分为两类。

(1) 使用静态网络性质研究传播问题。如Cha等[3]获取了照片在社交网络中的传播范围和传播速度, 并发现过半照片的“收藏”行为是由网络中的好友关系(即复杂网络中的边)决定的。Facebook上的实验研究发现强连接(Strong Tie)更具有影响力, 然而弱连接的数量才是决定新信息能否大规模传播的主要影响因素[13]。彭红彬等[8]针对CSDN技术论坛, 以用户为节点, 知识交流关系为边, 建立知识交流网络, 发现知识传播网络具有三角形的基本结构特征。然而该研究只涉及知识分享的静态网络性质, 并未考虑知识传播的动态过程。刘佩等[9]基于“知乎”精华区用户的社会网络, 定量研究网络的静态性质, 如小世界性质, 并通过个案分析指出中介中心度高有利于知识传播。邹儒楠等[14]以小木虫生命科学论坛为例, 充分分析了非正式学术交流的特点, 认为交流过程中权威的弱化、交流过程的多中心性, 有利于知识的转移和扩散, 但同样未涉及传播的动态过程。

(2) 应用动态传播模型分析传播过程。一部分研究建立模型, 通过传播结果推算传播路径乃至传播网络[15-16], 并根据测得的传播路径预测传播效果[17]。另有很多研究借鉴传染病领域的经典SIR模型及其改进模型[18-21], 分析信息的传播机制。如Pastor-Satorras等[22]基于SIS模型分析网络结构与计算机病毒传播的关系, 发现在度分布服从幂律分布的网络中, 病毒流行的门槛为零, 永远可以发生。Girvan等[23]研究了可突变的SIR模型, 发现在特定网络参数下, 疾病可以周期性爆发。Gruhl等[21]将博客中的信息传播分为传播话题和个体传播两层, 并分别使用SIR和SIRS模型进行实证研究。国内的学者也在这方面进行了有益探索, 如魏静[24]使用SIR模型研究网络流行语在不同的虚拟社区中的传播机制、王晓明[25]基于SIR模型提出微博信息的传播模型、张立凡等[26]基于SIR改进模型探讨媒体干预下网络舆情的传播规律。这些研究大多都是仿真研究, 并且没有实际数据支持仿真结论; 而其中的实证研究[21]也未考量网络的结构性质对网络动态传播过程的影响。

综上所述, 在虚拟社区知识传播的相关研究中, 基于静态网络性质的实证研究缺乏对传播动态过程的探索, 这样的研究只能得到网络性质和传播结果的相关关系, 需要进一步借助动态模型才能了解产生该相关关系的内在影响机制; 而基于动态传播模型的研究又多为仿真研究, 使用模拟数据的研究结论具有一定的局限性; 少数关于传播模型的实证研究也未涉及网络的静态性质对网络动态传播过程的影响。为了填补这个空白, 本文尝试把虚拟社区的静态网络性质、动态传播过程和实际数据相结合, 实证探求结构性质对传播过程的影响。

3 理论模型与变量计算

3.1 研究假设

位置中心性表示了一个节点在网络中位置的重要性。一个节点连接的节点越多、重要性越高, 则该节点的中心性越高。因此, 位置中心性高的节点产生的创新成果容易被更多的创新成员接触到, 即潜在受众越多。潜在受众越多, 最终的传播范围应当更广。Stieglitz等[27]的实证研究发现, 网络社交媒体Twitter上被关注人数(即网络节点的入度)越多的人所发的信息可以被更多的社区成员转发。文献[9]研究发现, 在问答社区知乎中入度较高的成员更容易吸引其他成员阅读和讨论。网络节点的入度是位置中心性的重要影响因素。因此, 有以下假设:

H1: 位置中心性越大, 潜在受众则越多, 进而扩大传播范围。

创新认可度是节点的属性, 指的是虚拟社区中创新成员的创新绩效被认同的程度, 取决于其他虚拟社区成员对该创新成员此前创新水平和创新绩效的认可。虚拟社交社区信息传播的实证研究发现, 信息发布成员的权威性可以对信息传播起到积极作用[28], 并且信息发布成员在平台上的历史时间越长, 越容易获得其他成员的信任, 其发布的信息也被认为具有较高的可信度和价值[29-30]。研究结果表明, 基于信任的“认同”因素可以提高知识欲求[31], 进而提高传播动机。创新认可度高的节点在虚拟社区中是被广泛认同的或最值得信任的创新成员, 当易感者接触到该节点的新增创新成果时, 会即刻共享并传播。所以得出以下假设:

H2: 节点创新认可度越高, 潜在受众的传播概率则越大, 进而提高传播速度。

聚集系数是节点附近的区域特性, 代表了与该节点相连节点的紧密程度。聚集系数越高, 表明“朋友”的“朋友”彼此之间也是“朋友”的概率越大。因此, 创新知识越容易集中在该“朋友”圈子中, 所以传播范围越小, 传播速率(单位时间内新增传播者的数量)也越小。虚拟社区的相关研究中, Lerman等[12]通过比较两个虚拟社区Twitter和Digg发现, 聚集系数高的网络虽然起初传播效率比较高, 但是后期动力不足, 最终传播范围较小。此前关于传染病传播的研究也表明, 聚集系数越高的网络, 传染病的传播效率越低[32]。由此, 有以下假设:

H3a: 区域聚集程度越大, 创新成果的传播范围越小。

H3b: 区域聚集程度越大, 创新成果的传播速率越小。

3.2 理论模型

根据以上假设, 本文建立创新成果在网络中传播的理论模型, 如图1所示:

图1   理论模型

   

3.3 变量计算

(1) 自变量计算

①位置特性计算[33]。节点的PageRank中心性(后文用位置中心性指代)是节点的位置属性, 度量了节点在网络中重要程度。一个节点的重要程度与该节点所连接节点的重要程度相关。若一个节点连接了很多具有较高中心性的节点, 那么该节点将具有较高的中心性。定义D为对角矩阵, , A为网络的邻接矩阵, 则所有节点的中心性组成的向量x计算如下:

经过数据清洗和整理后, 以创新成员为节点, 关注关系为边(关注者指向被关注者)建立创新成员关注网络, 并使用Gephi软件计算每个节点的位置特性PageRank, 参数α=0.85。

②区域特性计算。聚集系数(Clustering Coefficient)是节点的区域特性, 描述网络中节点间的聚集情况, 即目标节点附近区域网络的紧密程度。例如, 在朋友网络中, 一个人朋友的朋友可能也是他的朋友, 或者说他的两个朋友彼此可能也是朋友。聚集系数c就是表示一个人朋友的朋友也是他的朋友的概率。若节点i与其他k个节点相连, 且这k个节点之间存在e条边, 则节点i的聚集系数计算方法如下:

本文使用Gephi软件计算关注网络中每个用户的聚集系数作为区域聚集程度的度量。

③创新认可度计算。由于点赞是对创新成果的认可, 是创新绩效的一种衡量, 因此, 使用该成员所有创新成果获得的总赞数来衡量其他创新成员对该成员创新成果的认可度。为了更准确地描述创新成员开发某一个信息库时的认可度, 使用该创新成员开发该信息库前获得的所有点赞数作为创新认可度的度量。

(2) 中介变量和因变量计算

SIR模型为创新知识传播的内在机制提供了很好的研究依据。本文使用SIR模型中的变量对研究模型中的变量(潜在受众、传播概率、传播范围和传播速率)进行度量。

在传染病模型SIR模型中, S为易感状态, I为感染状态, R为康复状态。根据虚拟社区创新知识传播的方式, 重新定义模型中的变量如下: S状态是可能接触到创新知识并传播创新知识的状态, I是向其他创新用户传播创新知识的状态, R是不再传播该知识的状态, 参数β为网络中的节点从S状态到I状态的状态转移概率, 参数γ为网络中的节点从I状态到R状态的转移速率, S0为易感者的初始数量, N为网络中的节点总数。因此有微分方程[13]如下:

由于微分方程的参数有S0、I0、R0、β、γ。每一组参数可以唯一确定出S(t), I(t), R(t)曲线。根据传播真实数据, 可以计算出真实数据与该曲线的均方根误差(RMSE)。使用Matlab中的fminsearch函数寻找最小化均方根误差的一组参数, 获得最佳的拟合曲线, 并将其中的S0、β、γ、最终传播范围、最大传播速率5个参数值记录下来。

①潜在受众计算: 潜在受众对应SIR模型中的S0, 即传播时的易感人群。

②传播概率计算: 传播概率对应SIR模型中的β, 即易感状态到感染状态的状态转移概率。

③传播范围计算: t趋于无穷时, 处于康复状态的节点有极限值, 这个极限值就是所有“感染”过或者传播了新知识的个体。因此, 传播范围对应Rt(t→∞) 。

④传播速率计算: 由于传播速率没有解析解, 只能通过数值解获知每个时刻的传播速率。然而, 传播范围依时间收敛, 因此平均传播速率又没有意义, 故而本文选取最大传播速率, 也就是I变化最快时的速率, 作为传播速率的度量, 即max(dI/dt)。在变化速率最大处附近, 变化速率相对稳定, 速率具有代表意义。

4 实证研究与结果

4.1 数据准备

以全球最大的社交编程及代码托管网站GitHub为例, 研究创新知识在虚拟社区中的传播机制。在GitHub网站上, 创新成员将自己的创新成果写在信息库中(本文认为, 一个信息库就是一单位的创新知识), 其他创新成员通过点赞行为将该创新知识传递给更多的创新成员。本文利用GitHub的应用程序接口数据备份收集了约500万个创新成员的关注关系数据, 并根据关注关系建立社会网络。此外, 收集了2008年至今的全部传播历史, 随机选取250个传播人数超过100的信息库, 除去异常值, 用于创新知识传播的研究。

4.2 回归模型建立

记节点的位置中心性为X1, 创新认可度为X2, 区域聚集程度为X3, 潜在受众为ME1, 传播概率为ME2, 传播范围为Y1, 传播速率为Y2, 根据研究假设和研究框架, 建立如下回归模型:

4.3 实证研究结果

对回归分析的基本假设进行检验, 数据符合多重共线性等基本假设, 可以用于回归分析。使用SPSS Process Macro中的Model 4对H1和H2进行中介关系检验, 使用SPSS回归分析对H3a和H3b进行假设检验。

(1) H1的检验结果如表1所示, 可知b11=.14,t=2.19,p<.05, 位置中心性与传播范围呈正相关; b21=-.28,t=4.42,p<.001, 位置中心性与潜在受众呈正相关; b32=.48,t=7.89,p<.001, 潜在受众与传播范围呈正相关; b31=.01,t=.15,p=.88, 引入间接效应后直接效应不再显著, 因此该中介效应为完全中介效应, H1成立, 即社区成员处于社区网络中的核心位置(位置中心性)可以提高创新知识的潜在受众数量, 进而扩大创新知识的传播范围。

表1   H1中介关系检验结果

   

OutcomeModelcoeffsetpLLCIULCI
Y1(传播范围)X1(位置中心性)0.14410.06572.19390.02930.01470.2735
ME1(潜在受众)X1(位置中心性)0.28160.06374.42080.00000.15610.4070
Y1(传播范围)ME1(潜在受众)
X1(位置中心性)
0.4790
0.0092
0.0608
0.0608
7.8852
0.1518
0.0000
0.8795
0.3593
-0.1105
0.5987
0.1289

新窗口打开

(2) H2的检验结果如表2所示, 可知b41=.16,t=2.49,p<.05 , 创新认可度与传播速率呈正相关; b51=.29,t=4.52,p<.001, 创新认可度与传播概率呈正相关; b62=.20,t=2.92,p<.01, 传播概率与传播速率呈正相关; b61=.11,t=1.58,p=.12, 引入间接效应后直接效应不再显著, 因此该中介效应为完全中介效应, H2成立, 即创新认可度增加了创新知识的传播概率, 进而提高了创新知识的传播速率。

表2   H2中介关系检验结果

   

OutcomeModelcoeffsetpLLCIULCI
Y2(传播速率)X2(创新认可度)0.16280.06552.48600.01360.03380.2918
ME2(传播概率)X2(创新认可度)0.28720.06364.51810.00000.16200.4125
Y2(传播速率)ME2(传播概率)
X2(创新认可度)
0.1964
0.1064
0.0673
0.0673
2.9193
1.5818
0.0039
0.1151
0.0638
-0.0261
0.3289
0.2389

新窗口打开

(3) 由表3可知, 在传播范围的回归模型中, 区域聚集程度对应的卡方增量显著(p<.001)。区域聚集程度与传播范围呈负相关(a13=-.202,t=-3.231,p=.001), H3a成立, 即区域聚集减小了传播范围。由表4可知,在传播速率的回归模型中, 区域聚集程度对应卡方增量显著(p<.001), 区域聚集程度与最大传播速率呈负相关(a23=-.247,t=-3.9.3,p<.001), H3b成立, 即区域聚集降低了传播速率。

表3   H3a回归结果

   

H3a因变量: 传播范围BetatSig.
潜在受众.4677.863.000
位置中心性.000.007.994
区域聚集程度-.202-3.531.001

新窗口打开

表4   H3b回归结果

   

H3b因变量: 传播速率BetatSig.
传播概率.1832.804.005
创新认可度.0761.164.246
区域聚集程度-.247-3.903.000

新窗口打开

总结理论模型的检验结果如图2所示:

图2   检验结果(回归系数)
(注: *p<.05; **p<.01; *** p<.001)

   

综上, 统计检验的结果支持了研究假设。H1认为, 位置中心性通过增加潜在受众数量扩大传播范围。Stieglitz等[27]在关于Twitter的研究中发现, 关注者的数量和转发次数呈正相关关系。然而, 节点在网络中的重要性不仅与关注者的数量相关, 还可能与这些关注者的“质量”相关。网络中的位置中心性很好地体现出创新成员的关注者的数量和这些关注者本身在网络中的重要性。结果表明, 与社会媒体类似, 在创新社区中位置中心性和创新认可度在创新社区中同样可以对知识传播起到积极作用。本文进一步结合传播的动态模型, 证明位置中心性是通过中介变量潜在受众的数量, 正向影响了传播范围。

统计检验的结果支持了H2, 证明了创新认可度可以提高传播速率。此前关于微博的研究使用了回归的方法, 发现信息发布者的权威性可以提高信息的转发次数[28]。本文的结果表明, 创新认可度作为对创新成员权威性的一种体现, 可以有效地提高创新成果的传播速率。此外, 传播动态模型帮助解释该正相关关系的内在机制: 当创新成果的发布者具有的创新认可度越高, 接触到创新成果的创新成员越可能进一步传播该成果, 因此传播速率也越大。

本文的研究结果还说明, 区域聚集性会减小传播范围, 并且降低最大传播速率。Lerman等[12]在此前的研究中, 通过对比信息在Twitter和Digg两个社交媒体上的传播发现, 相比于Twitter, Digg用户网络节点间的联系更为密集, 信息虽然在最初的传播中速度比较快, 但是后期动力不足, 并且整体传播范围次于Twitter。然而两个社会媒体平台可能存在除网络结构性质外的其他差异, 比如信息传播效果不同可能是由参与两个社交媒体的人本身的不同导致的。本文研究对比了创新成果在同一平台上的传播效果, 降低了其他差异的混杂影响, 验证了在创新社区中区域聚集性与创新成果传播呈负相关关系。

5 结 语

随着互联网的发展和网络社区的大量涌现, 虚拟社区中的知识传播问题得到了越来越广泛的关注。本文针对虚拟社区知识传播的特点, 结合复杂网络静态性质和动态传播模型, 构建了虚拟社区创新知识传播的理论模型, 采用实证的方法研究了创新知识传播的动态机制。较之已有的研究, 本文充分考虑了虚拟社区所具有复杂网络的结构特性同时又兼顾了虚拟社区中创新知识传播的动态过程, 并在研究中使用了大量有效的实际数据, 讨论了结构特性对传播效果的内在影响机制, 验证并延伸了此前的研究结论, 具有理论和实践意义。由于本文结论基于旨在共享和交流的社交创新社区, 该机制是否适用于其他虚拟社区有待后续研究进一步分析探讨。此外, 未来研究工作需要进一步探索如何通过虚拟社区结构设计、成员间的交互方式设计、社区推荐系统算法设计等方法有效提高创新成员位置中心性和创新认可度、降低区域聚集程度。

作者贡献声明:

叶腾: 提出和设计研究命题, 获取与分析数据, 论文写作;

韩丽川: 提出研究思路, 设计研究方案, 论文修订;

邢春晓: 提出实验模型, 论文修订;

张妍: 实验分析, 论文修订。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: zxhui0@163.com。

[1] 叶腾. gh.csv. 基于复杂网络的虚拟社区创新知识传播机制研究.


参考文献

/