数据分析与知识发现  2018 , 2 (11): 80-94 https://doi.org/10.11925/infotech.2096-3467.2018.0293

研究论文

基于社会网络分析的网络问答社区知识传播研究

王忠义1, 张鹤铭1, 黄京2, 李春雅3

1华中师范大学信息管理学院 武汉 430079
2武汉职业技术学院 武汉 430074
3南通理工学院商学院 南通 226002

Studying Knowledge Dissemination of Online Q&A Community with Social Network Analysis

Wang Zhongyi1, Zhang Heming1, Huang Jing2, Li Chunya3

1School of Information Management, Central China Normal University, Wuhan 430079, China
2Wuhan Polytechnic, Wuhan 430074, China
3School of Business, Nantong Institute of Technology, Nantong 226002,China

中图分类号:  TP393

通讯作者:  通讯作者: 李春雅, ORCID: 0000-0001-7155-4658, E-mail: 10880945@qq.com

收稿日期: 2018-03-16

修回日期:  2018-05-29

网络出版日期:  2018-11-25

版权声明:  2018 《数据分析与知识发现》编辑部 《数据分析与知识发现》编辑部

展开

摘要

【目的】通过分析网络问答社区的社会网络结构和知识传播机制, 研究节点在网络问答社区的知识传播与学习的效用, 从而指导用户在网络问答社区中更高效地学习。【方法】结合社会网络分析方法和熵权法描绘意见领袖的知识能力和传播影响力, 而后针对网络问答社区社会网络的小世界特征, 在借鉴Cowan模型的基础上建立一个知识传播模型, 并通过系统模拟仿真对该网络内部的知识学习效果进行实验。【结果】知识存量越少的节点在网络中的学习效率越高, 该现象类似于森林的“海绵效应”; 一些节点的知识存量增长较快, 其知识存量的增长倍数远远大于那些当初知识存量较高的节点; 随着时间的增长, 网络的知识传播速率一直处于下降的趋势; 知识增量与知识能力指数和传播能力指数都有很强的关系。【局限】在关于传播动力学模型的假设上, 本文未考虑到网络的动态随机重连。【结论】本文较为客观地评价了网络问答社区的知识传播与学习效用的情况, 并提出相应建议以提升用户在网络问答社区中的学习效果。

关键词: 社会网络分析 ; 信息熵 ; 知识传播 ; Cowan模型 ; 海绵效应

Abstract

[Objective]This paper analyzes the social network structure and knowledge dissemination mechanism of an online Q&A community, aiming to reveal the role of network nodes, and improve the learning efficiency. [Methods] First, we used the social network analysis and the entropy weight methods to describe the opinion leader’s knowledge and influence. Then, we built a knowledge dissemination model based on the Cowan model for the Q&A community. Finally, we examined the internal knowledge learning results of the network through system simulation. [Results] Ⅰ. The nodes with less knowledge had higher learning efficiency in the target network; Ⅱ. The knowledge volumes of some nodes increased rapidly, while those of the nodes with larger knowledge stock increased slowly; Ⅲ. The knowledge dissemination rate of this network has been decreasing; Ⅳ. There is strong correlation between knowledge increase and the index of knowledge and communication abilities. [Limitations] The dynamic random reconnection of network was not examined in this paper. [Conclusions] This paper offers practical advice to improve users’ learning experience in the online Q&A community.

Keywords: Social Network Analysis ; Information Entropy ; Knowledge Dissemination ; Cowan Model ; Spongy Effect

0

PDF (3421KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

王忠义, 张鹤铭, 黄京, 李春雅. 基于社会网络分析的网络问答社区知识传播研究[J]. 数据分析与知识发现, 2018, 2(11): 80-94 https://doi.org/10.11925/infotech.2096-3467.2018.0293

Wang Zhongyi, Zhang Heming, Huang Jing, Li Chunya. Studying Knowledge Dissemination of Online Q&A Community with Social Network Analysis[J]. Data Analysis and Knowledge Discovery, 2018, 2(11): 80-94 https://doi.org/10.11925/infotech.2096-3467.2018.0293

1 引 言

Web2.0环境下, 互联网用户不仅仅是知识的浏览者, 还是知识的生产者。这种网络模式改变了传统的知识传播形式, 网络问答社区作为该知识传播形式的典型代表, 它采用网络协作的方式将互联网的所有用户组成高效的社会协作网, 互相解决对方提出的问 题[1]。网络问答社区是社会化网络虚拟社区的创新应用, 它提供了高质量的知识分享平台, 摆脱了传统问答平台的缺陷, 充分体现了用户为中心和社交化理念, 受到学术界和商业界的广泛关注[2]。目前, 随着海量网络信息的出现, 互联网用户获取所需资源的效率引发了许多学者的思考, 而用户在网络问答社区中的知识传播和学习效果如何以及如何较好地提升学习效果等问题的探讨还较少。由此, 本文以网络问答社区中的用户为研究对象, 将其抽象为社会网络结构中的节点, 从而分析网络问答社区的社会网络结构特征, 依据网络特征构建一个知识传播模型以研究节点在网络问答社区的知识传播与学习的效用且对用户在网络问答社区中的学习效果给予评价, 并提出相应建议来提升学习效果, 这将对用户在网络问答社区中高效学习有较强的指导意义。

2 研究现状

网络知识问答社区作为知识交流与传播的重要平台, 不仅得到用户的广泛使用, 而且越来越多的学者开始对其进行深入的研究。目前针对网络问答社区的相关研究主要集中于网络问答社区用户的特征分析及行为分析、知识传播模式的推断和知识传播效用的定性分析等方面。

(1) 在用户特征分析及行为分析方面, 金家华[3]从宏观和微观两个层面探索用户在问答社区的参与行为及影响因素, 并认为基于认同的信任关系、前期知识搜寻获得的反馈、互惠规范对用户的持续知识搜寻行为有正影响; 陈娟等[4]通过R语言对抓取到的社会化问答平台用户个人特征与行为的客观数据进行样本分类, 并对每一种分类的行为特征进行归纳分析; 黄梦婷等[5]主要探讨在线问答社区用户之间的协作发起和响应、协作内容的类型以及效果的差异性并对知乎社区的协作提出一些建议; 刘佩 等[6]研究以“知乎”为代表的网络问答社区的社会网络宏观结构特征, 分析出度和入度高的用户在此社会网络中的行为特征并对网络问答社区的问题和回答内容特点进行分析; Liu等[7]通过训练出的回答预测模型对网络问答社区的问题回复率进行测试, 发现问题的可回答性主要取决于提问者与问题, 且如果问题带有表情符号可以增强问题被回复的可能性; Jin等[8]主要探讨用户为网络问答社区贡献问题回答的持续意愿的原因, 并认为其主要来源于自我展示、同行认可和社会学习的需求; Lou等[9]通过问卷调查的形式对主流网络问答社区的用户进行样本采集, 并分析出激励用户为网络问答社区贡献回答的因素主要是: 名誉奖励系统、学习知识的效用和乐意帮助的心理。

(2) 针对知识传播模式的推断和知识传播效用的定性分析方面, 左遥等[10]通过归纳出基本的知识传播方式从而提出一种社会化问答网站知识传播网络推断方法, 分别提取节点类型、节点时间关系及候选传播者排序特征推断关注关系, 采用启发式方法推断另外三种关系, 生成知识传播网络; 宁菁菁[11]通过“弱关系理论”分析知乎的知识传播机制并对其知识传播特征和效果进行定性的分析。

综上, 针对网络问答社区知识传播的特征模型构建、分析和学习效用评价的相关研究还不完善, 尤其对于其知识传播的模型构建和定量分析的研究较少。因此, 本文通过借鉴Cowan模型[12]深入剖析网络问答社区知识传播机制, 并建立新模型完成仿真模拟知识学习效果, 从而对网络问答社区的学习效用做出评价并给出相应建议, 这有利于指导用户在网络问答社区中更高效地获取知识。

3 网络问答社区知识传播研究框架

为了实现对网络问答社区的传播模型构建、分析和学习效用评价, 本文大致沿袭了数据采集、数据预处理、数据使用和数据分析的一般范式设计研究框架, 如图1所示。

图1   网络问答社区知识传播研究框架

   

(1) 数据收集: 获取用户的相关数据;

(2) 社会网络构建: 根据收集数据中用户的相互关注关系构建社会关系网络;

(3) 社会网络宏观结构分析: 从社会网络的整体出发, 使用R语言实现社会网络特性分析;

(4) 指数识别: 使用R语言对社会网络的节点进行相关参数分析, 在已获得的用户特征数据和社会网络微观结构分析的数据中, 进行相关性分析和层次聚类分析, 将数据聚类为知识能力和传播影响力。在此基础上, 结合熵权法得出用户的知识能力指数和传播影响力指数;

(5) 隐性知识传播动力学模型构建: 结合之前的社会网络特征分析, 针对其特征在改进Cowan模型的基础上构建知识传播动力学模型;

(6) 隐性知识传播系统仿真模拟: 将已处理的数据结合动力学模型, 对用户知识传播与学习的行为通过Matlab[13]进行系统仿真模拟;

(7) 知识传播和学习效果的评估与分析: 通过分析系统的仿真模拟结果, 得出相关实验结论并对网络问答社区的知识学习效果做出评价和提出相关建议。

4 数据收集以及网络构建

4.1 数据收集

“知乎”作为目前国内最受欢迎的知识型网络问答社区[6], 采用精英与专家相结合的路线, 其高质量的问答、理性友好的讨论氛围等方式使得其在蓬勃发展的网络问答社区中脱颖而出。由于最大程度调动了用户甄别问题的质量, “知乎”构建了高质量问答社区[1]。为此, 本文以“知乎”社区作为研究对象, 探索网络问答社区知识传播和学习效果。

本文从“知乎”共爬取420 981个用户数据, 爬虫的截止日期为2017年2月。在得到用户的数据后, 针对获得的数据粗略筛选出一定数量的意见领袖。所谓网络意见领袖, 是指以互联网为平台, 针对社会热点问题发表自己的言论和见解, 并得到网民普遍认可或高度认同, 从而引导网络舆论走向, 对网民意见产生重大影响的网络信息发布者[14]。基于以上对意见领袖标准的描述, 借鉴美国加利福尼亚大学圣地亚哥分校的物理学家乔治·赫希在2005年提出的H指数(H-index)对知乎用户进行科学筛选。H指数是一种科学评价计量, 该指数既能反映学术论文影响力大小, 又能同时反映其重要论文产出数量的多少[15]。本文基于H指数的核心思想, 从两个维度衡量意见领袖: 被关注人数以及获得赞同数量, 将以上两个数量上均大于100 000的用户筛选出来作为意见领袖, 总共得出80位“知乎”意见领袖, 如表1所示。

表1   80位意见领袖, 按赞同数量(agree)排名

   

序号usernameagreefollowers序号usernameagreefollowers
01肥肥猫1 218 509353 53541warfalcon246 569478 527
02朱炫1 128 626579 45942孙志超239 546185 374
03ze ran1 029 394207 67843马力235 034204 201
04vczh983 884467 59844藥師233 497112 765
05寺主人940 156454 21745闻佳227 652294 435
06Hannibal Lecter841 383222 94446蔓玫219 097126 074
07yolfilm835 981732 46347高科218 227505 662
08菠菜685 089340 04448汪惟212 827306 975
09孟德尔646 872195 37649pansz208 025212 482
10Kaiser635 745277 57150Lightwing202 779132 399
11一笑风云过628 206181 99151带三个表199 884312 977
12银教授603 600270 01552沃金196 759118 629
13曾加581 484204 86453李楠190 009415 213
14谢熊猫君575 400389 78254张亮187 148697 974
15Justin Lee526 041160 48555何明科181 619129 164
16君临483 966182 30756ALEX YA181 589104 854
17windleavez463 623106 68057负二180 996398 218
18护耳大脸453 444120 56758小岩井177 677114 498
19李松蔚432 592305 22659李暘171 104128 141
20苏菲418 907342 30360葛巾168 827580 650
21安雅392 539147 14761maggie168 648552 459
22王路377 760107 66562Sophia165 521101 880
23梁边妖361 965540 80463不鳥萬如一160 960397 024
24倪一宁360 068153 02364欲三更151 195158 159
25李淼347 455623 38565喻忘忧146 550106 649
26极乐344 128114 50866楚沐风146 530119 321
27蒋校长341 507152 87167Raymond Wang144 990484 481
28动机在杭州310 503452 61968殷守甫142 391121 032
29刘鹏程Sai.L309 067165 13369徐强141 421148 944
30刘念302 048267 13770纽约老李校长137 423136 041
31猪小宝296 676134 04771东东枪135 709198 629
32徐湘楠295 563106 90972唐僧同志133 168126 723
33陈章鱼291 457516 40973楠爷131 511129 417
34cOMMANDO289 557355 50874覃超118 423123 436
35顾扯淡283 796236 15175周晓农118 290481 778
36夏吉吉273 456144 22476涛吴116 545182 749
37命硬的eno270 775162 77977谭蔓茹114 534152 995
38David Rand265 537205 26678Lydia112 501123 632
39雷幺幺262 207115 09279李开复108 208981 917
40汗青257 863111 97980夏昊BFA101 281197 867

新窗口打开

4.2 社会网络构建

将“知乎”用户抽象为社会网络中的节点, 基于用户关注与被关注关系构建关注关系矩阵, 关注某位用户则表示为1, 不关注则表示为0。由于数据庞大, 这里仅展示80位意见领袖的前20位的有向关注关系矩阵, 如表2所示。

表2   前20位意见领袖的关注关系矩阵

   

序号0102030405060708091011121314151617181920
0101100001011000110100
0210000001011101001010
0310000001001011110010
0400001011101000001001
0500000100000100000000
0611011011111101110010
0700001000100001010010
0811110110001011100110
0900000010000000010000
1011010100001010011000
1111101011000011101011
1201000001010001000000
1310011000010001000010
1401100011000000100011
1511111111110111010010
1611001011010001100011
1701000010110010000000
1810000010000000000000
1901000011000011000001
2001000000000001000010

新窗口打开

将关注关系矩阵导入Rstudio[16], 并在R语言中借助iGraph包建立有向图函数。在函数中, 各个节点是被抽象化的用户, 关注关系是依据矩阵每行中的0 和1确定两个节点之间是否连线, 并且依据“知乎”情境, 将函数direct值设置为T来建立有向关注关系。在建立有向图的同时, 为了能够更加形象化地描述节点的重要性程度, 对于节点的大小, 依据节点的中间中心度属性来调节。中间中心度大于100的节点, 节点size属性设置为16; 小于等于30的节点, size属性设置为6; 其余节点的size属性都设置为默认的10。这样即可绘制出意见领袖的社会网络关系的有向图, 如图2所示。

图2   “知乎”社区80位意见领袖的关系网络

   

4.3 社会网络宏观结构分析

经过R语言中graph.Density, mean_distance和transitivity函数的计算, 分别得到该社会网络的网络密度: 0.3753165; 网络平均路径长度: 1.649209; 网络聚集系数: 0.6202949。通过这些数据可以认为, 该网络符合小世界网络高聚集系数、低平均路径长度的特 征[17], 网络密度比较大, 成员之间的关系比较紧密。此外, 从社会网络关系图中可以明显看出核心-边缘结构, 核心节点对于该社会网络有较强的影响力。意见领袖的关注关系网络的小世界性质为隐性知识传播动力学模型的构建奠定了理论基础。

5 指数识别

5.1 社会网络微观结构分析

本文从“知乎”共爬取19个用户字段, 如表3所示。去除不是主键的字段: address, education, company, job, headline, 删去重复标记的主键: user_id, index_url, 再删除对评价用户不重要或冗余的字段: sex, weibo, token, 最终抽取其中9个字段刻画用户的特征, 如表 4所示。

表3   从“知乎”获取的19个字段名称

   

字段名
usernamecompanyuser_idarticleeducationquestionthankedtopicfollowersweibo
addressjobanswerindex_urlheadlineagreefollowingtokensex

新窗口打开

表4   前10位意见领袖特征描述

   

usernameanswerquestionarticleagreethankedfollowersfollowingtopic
肥肥猫39789121 218 509304 153353 53525711
朱炫1964471 128 626245 011579 45920437
ze ran2 519061 029 394198 023207 678703137
vczh13 68845946983 884130 151467 5981 84130
寺主人14941156940 156192 639454 21771458
Hannibal Lecter97232149841 383188 170222 94416 884292
yolfilm1 5091062835 981198 641732 463226134
菠菜1 2951937685 089190 034340 04453649
孟德尔5 09686147646 872141 033195 3761228

新窗口打开

为获取“知乎”中意见领袖的影响力特征, 获 得用户中间中心度(betweeness)数据后, 进行社 会网络微观结构分析, 以获取意见领袖的出度(degree.out), 入度(degree.in), 点度中心度(degree. total), 接近中心度(closeness), 特征向量中心度(evcent), pagerank指数, 结构洞指数(shole) 等, 如表5所示。由此, 可以更加全面地描述意见领袖的影响力。

表5   前10位意见领袖节点影响力分析

   

usernamebetweenessdegree.outdegree.indegree. totalclosenessevcentpagerankshole
肥肥猫63.962635610.00760.10750.013736
朱炫95.053547820.00810.14420.018152
ze ran11.421420340.00690.06480.007621
vczh15.671420340.00690.05890.007529
寺主人34.57835430.00650.07370.013538
Hannibal Lecter72.484822700.00910.11870.009951
yolfilm94.762948770.00770.13360.021848
菠菜120.514344870.00870.15240.016653
孟德尔3.47620260.00600.04840.007423

新窗口打开

汇总发现以上数据共有16维。考虑到维度过高, 不利于数据分析, 将通过一些数据降维的方法概括用户的属性, 方便进一步分析用户特征。

5.2 相关性分析

首先, 通过相关性分析合并关系比较紧密的数据。为此, 借助R语言中cordata函数对16维数据进行相关分析, 相关性系数如表6所示。从相关分析的结果可以发现赞同数与感谢数有很强的关系; 中间中心度、出度、入度、点度中心度、接近中心度、特征向量中心度、pagerank、结构洞指数之间有很强的相关性(见表6中加粗数据)。

表6   80位意见领袖16维数据的相关性

   

answerquestionarticleagreethankedfollowersfollowingtopicbetweenessdegree.outdegree.indegree.totalclosenessevcentpagerankshole
answer1.000.390.120.290.120.170.09-0.01-0.09-0.17-0.06-0.15-0.15-0.16-0.05-0.10
question0.391.000.29-0.02-0.060.290.050.150.07-0.080.11-0.01-0.09-0.020.210.02
article0.120.291.00-0.07-0.14-0.030.040.090.02-0.040.04-0.01-0.05-0.010.11-0.02
agree0.29-0.02-0.071.000.920.200.14-0.050.08-0.070.07-0.02-0.06-0.030.00-0.03
thanked0.12-0.06-0.140.921.000.240.130.010.160.030.150.100.040.090.080.07
followers0.170.29-0.030.200.241.00-0.020.090.17-0.120.520.17-0.160.180.560.14
following0.090.050.040.140.13-0.021.000.250.190.22-0.010.160.230.130.010.20
topic-0.010.150.09-0.050.010.090.251.000.130.250.050.210.240.200.030.23
betweeness-0.090.070.020.080.160.170.190.131.000.760.660.880.730.850.650.81
degree.out-0.17-0.08-0.04-0.070.03-0.120.220.250.761.000.300.880.990.850.250.90
degree.in-0.060.110.040.070.150.52-0.010.050.660.301.000.710.240.740.940.57
degree.total-0.15-0.01-0.01-0.020.100.170.160.210.880.880.711.000.850.990.650.94
closeness-0.15-0.09-0.05-0.060.04-0.160.230.240.730.990.240.851.000.810.200.88
evcent-0.16-0.02-0.01-0.030.090.180.130.200.850.850.740.990.811.000.670.91
pagerank-0.050.210.110.000.080.560.010.030.650.250.940.650.200.671.000.53
shole-0.100.02-0.02-0.030.070.140.200.230.810.900.570.940.880.910.531.00

新窗口打开

为更加显示地刻画参数之间的相关性程度, 借助R语言car包中的scatterplotMatrix函数分别绘制出中间中心度、出度、入度、点度中心度、接近中心度、特征向量中心度、pagerank、结构洞指数之间的相关性, 如图3所示。根据表6图3, 选择筛选掉相关性较大的维度和冗余的数据, 保留其中之一即可。于是, 在16个维度的基础上, 本文采用赞同数量(agree)代替感谢数量(thanked), 出度(degree.out)代替接近中心度(closeness), 入度(degree.in)代替pagerank指数, 点度中心度(degree.total)代替特征向量中心度(evcent), 而关注数量(following)和被关注数量(followed)可以通过其他影响力指数体现, 在这里可以直接删去, 最后保留10个维度。

图3   节点影响力分析的8维数据相关性

   

5.3 层次聚类分析

为深入揭示10个维数据的共性特征, 实现数据的进一步降维, 通过层次聚类法对其进行聚类分析。在层次聚类之前, 借助R语言中线性归一化函数[18](见公式(1))对数据进行归一化处理以统一量纲; 再利用hclust函数对数据实现欧氏距离聚类(见图4)。

${x}'=\frac{\max (x)-x}{\max (x)-\min (x)}$ (1)

图4   10个维度数据层次聚类结果

   

图4可以看出, 分析节点影响力的5个维度数据(即, degree.in、betweeness、degree.out、degree.total、shole)之间有很强的相关性。除此之外, 其他5个用户属性维度(即, agree、topic、article、answer、question)之间的聚类效果也很明显。基于以上聚类的结果, 本文将分析用户节点影响力的5个维度数据归类为传 播影响力, 将描述用户特征的这5个维度归类为知识能力。

5.4 利用熵权法评估节点

为了能够更加客观考量每个因素的权重, 本文引入熵权法确定权重。信息熵是消除不确定性所需信息量的度量, 即未知事件可能含有的信息量[19]。应用信息熵可以度量获取数据所提供的信息量, 并依据此确定各指标的权重[20]。信息熵的计算方法[20]如公式(2)所示。权重计算方法[19]如公式(3)所示。

$Entropy(j)=\ln m\times \sum\limits_{i=1}^{m}{(\frac{{{d}_{i,j}}}{\sum\limits_{i=1}^{m}{{{d}_{i,j}}}}\times \ln (\frac{{{d}_{i,j}}}{\sum\limits_{i=1}^{m}{{{d}_{i,j}}}}))}$ (2)

j=1,2,…,n,di,j有m行n列,m=80,n=10

$Weight(j)=\frac{1-Entropy(j)}{n-\sum\limits_{j=1}^{n}{Entropy(j)}}\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $. (3)

其中, j表示每一个因素的信息熵; i表示每个数据维度下80位意见领袖的相关因素数据。借助Matlab可以计算出每个因素的信息熵和权重, 如表7所示。

表7   信息熵数值和熵权数值

   

因素信息熵权重因素信息熵权重
answer0.80810.1949betweeness0.91700.3901
question0.68670.3182degree.out0.95270.2223
article0.76650.2371degree.in0.97980.0949
agree0.89350.1082degree.total0.96800.1506
topic0.86070.1415shole0.96980.1421

新窗口打开

在得到这10维数据在各自聚类中的权重之后, 对之前归一化后的数据使用加权求和的方式最终得到这80位意见领袖的知识能力指数和传播影响力指数, 如表8所示。

表8   知识能力指数和传播影响力指数

   

用户知识能力传播影响力用户知识能力传播影响力用户知识能力传播影响力
肥肥猫23.7745.10动机在杭州9.2464.57何明科9.8620.25
朱炫21.2967.28刘鹏程Sai.L26.3320.75ALEX YA2.9944.67
ze ran28.0314.39刘念6.1833.14负二19.1998.45
vczh70.3517.63猪小宝8.5620.75小岩井2.3743.71
寺主人24.7527.61徐湘楠23.8991.96李暘16.7540.58
Hannibal Lecter34.5358.36陈章鱼15.2820.29葛巾0.7472.70
yolfilm25.2063.31cOMMANDO11.2141.45maggie6.0280.88
菠菜16.7777.90顾扯淡9.8524.32Sophia1.3931.76
孟德尔54.348.34夏吉吉2.6410.67不鳥萬如一95.0026.46
Kaiser11.7444.06命硬的eno2.7932.39欲三更12.9686.40
一笑风云过16.7363.06David Rand12.1513.62喻忘忧1.9563.49
银教授13.418.72雷幺幺3.6614.68楚沐风2.9123.91
曾加12.0371.10汗青12.7480.08Raymond Wang8.0053.73
谢熊猫君13.5357.75warfalcon29.7873.38殷守甫1.5618.04
Justin Lee7.83100.00孙志超26.4819.28徐强8.188.09
君临8.5878.61马力60.2170.62纽约老李校长10.3190.03
windleavez15.2111.69藥師13.4632.31东东枪11.0135.73
护耳大脸10.970.00闻佳4.1438.34唐僧同志2.9446.39
李松蔚10.9644.45蔓玫5.0429.77楠爷3.8743.25
苏菲12.6945.34高科6.4110.27覃超9.1614.32
安雅9.8137.48汪惟10.2664.13周晓农8.9747.54
王路22.3938.22pansz13.0434.85涛吴10.2937.20
梁边妖10.2679.40Lightwing3.6831.17谭蔓茹2.6113.39
倪一宁3.7651.21带三个表9.2719.16Lydia2.6389.12
李淼21.2339.31沃金2.7929.81李开复31.1613.02
极乐10.1245.18李楠23.1316.28夏昊BFA35.4562.92
蒋校长8.921.13张亮72.1270.08

新窗口打开

为了对知识能力和传播影响力做出评价, 绘制图5所示的分布图。可以发现传播影响力指数分布不是很集中, 每个分数段的人群数量比较平均。知识能力指数的分布是一个左偏态的分布, 说明知识能力的分布不平均, 个体之间的差异较大, 这为用户在这样的社区内学习提供了广阔的空间。

图5   80位意见领袖权威指数评估

   

6 隐性知识传播动力学分析

6.1 隐性知识传播动力学模型构建

本文在社会网络宏观结构分析中指出网络问答社区社会网络符合小世界模型高聚集系数、低平均路径长度的特征, 针对此种特性, 从香农模型[21]、SIS传染病模型[22]和Cowan知识传播模型中, 笔者选取Cowan知识传播模型进行模型构建。

选择Cowan模型的主要原因在于需要研究个体节点的知识学习效果, 而香农模型忽视了节点之间客观存在的影响力[23], SIS传染病模型只能粗略描述节点是否拥有某一知识, 对于揭示节点知识存量的增长率和增长量能力较弱, 而Cowan模型很好地考虑到节点之间的隐性知识传播作用关系、能更好地反映知识网络微观变化等方面的原因。但Cowan模型没有考虑用户的知识沉淀和隐性知识表出化需要消耗一定的时间, 因此本文增加了假设(1)。此外, 考虑到要将模型置于网络问答社区的知识传播过程中, 本文对Cowan模型又增加了假设(2)、假设(3)和假设(4)。

(1) 考虑到知识沉淀和隐性知识外化的时间消耗过程, 设定学到的知识要经过两个单位时间的延迟才可以传播;

(2) 考虑到意见领袖的基础知识存量差异较小, 认为节点在知识前沿领域的知识存量就是节点的知识能力指数;

(3) 考虑到由于知识势差, 知识会自动从知识存量高的节点传播至知识存量较低的节点[24], 认为节点之间知识存量存在差异就存在知识传播;

(4) 考虑到系统仿真时间长度较短的原因, 并没有设置知识存量的上限。

隐性知识传播动力学模型如图6所示, 可以看出在t=1时, 节点j通过自学习, 将自身的知识存量kj(t)增加到nj(t+1)。由于隐性知识显化需要一定时间, 所以本文设定延迟时间为两个单位时间, 因此在这次学习过程中, 其他节点如节点i将自己外化的知识ki(t)传授给节点j, 使得节点j的知识存量增加到kj(t+1)。在t=2,3,···时刻, 节点j同样通过自学习, 将自身的知识存量kj(t+1)增加到nj(t+2)。在此次学习过程中, 其他节点如节点i将自己外化的知识ki(t)传授给节点j, 使得节点j的知识存量从nj(t+2)增加到kj(t+2)。

图6   1阶时间延迟的隐性知识传播模型示意图

   

在上述的知识转化过程中, 必须存在节点i对节点j的知识势差, 籍此, 知识才能发生传递。本文将上述过程在Cowan模型的基础上进行改进作为新的传播动力学模型, 如以下方程组所示。

$\begin{equation} \left\{\begin{array}{**lr**} {{n}_{j}}(t+2)={{k}_{j}}(t+1)(1+\beta ) \quad \quad\quad\quad\quad\quad\quad \quad\quad\quad (4)\\ {{k}_{j}}(t+2)={{n}_{j}}(t+2)(1+g({{k}_{i}}(t),{{n}_{j}}(t+2)))\times {{P}_{j,i}}\\ P为邻接矩阵\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad(5)\\ g({{k}_{i}}(t),{{n}_{j}}(t+2))=\max \{0;r_{j,i}^{{}}(1-r_{j,i}^{{}})\}\quad\quad\quad\quad(6) \\ r_{j,i}^{{}}=\frac{{{k}_{i}}(t)}{{{n}_{j}}(t+2)}\quad\quad\quad\quad\quad(7) \\ t=2,3,\cdot \cdot \cdot \quad\quad\quad(8) \end{array} \right. \end{equation}$

上述方程组中, 式(4)表示节点j通过自学习, 将自身知识从kj(t+1)提升至nj(t+2), 其中自学习增长率为β; 式(5)-式(7)联立, 可以计算出节点j在一个单位时间后经由函数g得到的传播率而最终得到的知识存量, 这里考虑到两个单位时间的延迟, 将传输节点两个单位时间之前未自学习的知识存量ki(t)与节点j此时刻的知识存量的比率作为判定标准, 并依据最大值函数从而判定两个节点之间是否存在知识势差。最后依据两个节点之间的邻接矩阵判断两个节点之间是否存在知识传播关系, 从而得到最终节点j在经过一个单位时间后的知识存量。还需要说明的是, 虽然式(8)是从t=2开始计算的, 但是在现实情境中, t=1是具有实际意义的, 在算法实施的时候t=1需要另外考虑, 从t=2开始的数据才具备仿真模拟效果, 所以在最终的绘图中(见图7图9), 都是从t=2时刻开始。

图7   t=40时系统仿真模拟结果

   

图8   t=60时系统仿真模拟结果

   

图9   t=100时系统仿真模拟结果

   

6.2 隐性知识传播系统仿真模拟

为了能够对本网络用户知识传播与知识学习效用进行更深入的分析, 通过计算机系统仿真模拟现实 中知识传播与学习的形势演化及其发展过程[25], 因此设计了计算机系统仿真模拟的算法, 如算法1和算法2所示。

初始参量: K是知识存量矩阵, 在t=1时赋初值; N是自学习后知识存量矩阵; β=0.0005是节点自学习知识增长率(β值经过多次调试, 这里选择一个较符合现实情境的值); T为仿真模拟次数; G是每个时期节点知识存量增长率; P是邻接矩阵(即关注关系矩阵)。

算法1: 隐性知识传播算法

1: t=1

2: for $t\le T\ \mathrm{do}$

3: ${{N}^{(t+1)}}={{K}^{(t)}}\times (1+\beta )$//节点通过自学习增长知识存量

4: for每个$k_{j}^{(t)}\in {{K}^{(t)}}$do//针对t时刻节点j的知识存量变化

5: for每个${{p}_{j,i}}\in {{P}_{j}}$ do

6: if t=1

7: call$ g(k_{i}^{(t)},n_{j}^{(t+1)})\ \ $//引入g函数

8: $G_{j}^{(t)}=G_{j}^{(t)}+g(k_{i}^{(t)},n_{j}^{(t+1)})\times {{p}_{j,i}}$

9: else

10: $\mathrm{call}\ g(k_{i}^{(t-1)},n_{j}^{(t+1)})$

11: $G_{j}^{(t)}=G_{j}^{(t)}+g(k_{i}^{(t-1)},n_{j}^{(t+1)})\times {{p}_{j,i}}$

12: end if

13: end for

14: $k_{j}^{(t+1)}=n_{j}^{(t+1)}\times (1+G_{j}^{(t)})\ \ $//节点jt时刻的知识存量增长

15: end for

16: t=t+1

17: end for

算法2: g函数生成过程

1: k'.是算法1中g函数的第一个传递参数, n'是第二个传递参数

2: ratio=k'/n'.

3: $\mathrm{if}\ \ ratio\times (1-ratio)<0$

4: $g(k',n')=0$

5: else

6: $g(k',n')=ratio\times (1-ratio)$

7: end if

将系统模型的方程转化成Matlab代码, 通过Matlab系统仿真来模拟意见领袖知识学习效果, 结果如图7图9所示。每个子图中所展现的数据的计算方式如下:

①整个网络每个时刻净学习增量$\frac{1}{80}\sum\limits_{i=1}^{80}{\ \left[ {{k}_{i}}(t+1)-{{n}_{i}}(t+1) \right]}$$(t=1,2,\cdot \cdot \cdot )$;

②整个网络每个时刻知识传播速率$\frac{1}{80}\sum\limits_{i=1}^{80}{{{G}_{i}}(t)}(t=1,2,\cdot \cdot \cdot )$;

③每个节点知识学习速率的平均值$\frac{1}{t}\sum\limits_{i=1}^{t}{{{G}_{i}}(t)}(i=1,2,\cdot \cdot \cdot )$;

④每个节点知识存量的增长倍数$\frac{{{k}_{i}}(t+1)}{{{k}_{i}}(1)}(i=1,2,\cdot \cdot \cdot )$。

6.3 隐性知识传播系统仿真模拟结果定性分析

(1) 节点知识存量越低, 节点的学习速率越高, 同时节点的知识增量也越高。这符合人们对于学习效果的基本认知, 即当知识存量较少的人在同比其知识存量高许多的人群处在一起, 可以显著地提升他们的知识存量。但是在知识存量增长倍数方面, 随着时间的增长, 增长最快的一部分群体是起始知识存量在10左右的群体, 这意味着进入这样一个群体学习, 低知识存量节点的学习效果要明显优胜于高知识存量的节点。但是, 这是基于一定前提的, 知识存量过低意味着学习能力不强, 过早进入这种层次的网络, 学习效果也不会很凸显。

(2) 有些节点是具备后发优势的。他们由于知识存量较少便在网络中潜心学习, 在经过一段单位时间的学习后, 其知识存量的增长倍数远远大于那些当初知识存量较高的节点。这说明, 一些节点在该网络中的知识话语权可能还会逐渐改变, 一些节点可能会成为该网络中的新兴知识权力节点, 而一些节点可能会因为骄傲或偏见而逐渐被边缘化。

(3) 在观测t=100时整个网络的知识传播速率可以发现, 随着时间的增长, 网络的知识传播速率一直处于下降的趋势。这说明, 长期处于某一固定群体当中, 用户的知识水平会趋于比较平稳的状态, 中间层次的用户之间的差异会相对减少。而中间层次用户差异的减少必然会导致用户对知识学习的“免疫”, 从而对网络中的知识产生厌倦。这启示用户要不断更新自己的关注对象, 及时关注网络中的新兴知识权力节点, 从而使得自身的学习效果达到更好的状态。

综上, 以上现象与森林的“海绵效应”类似, 在节点自身的知识存量低于外界时, 会主动吸收知识, 而且节点知识存量越少其吸收速率越高; 反之, 节点自身的知识存量高于外界时, 会选择放水。但是, 当一个节点的知识存量过低时, 节点自身的学习能力极其微弱, 就像一块干燥坚硬的海绵, 无论其吸收速率还是吸收增量都是极低的。而如果长期处于同一种环境下, 用户间的知识水平会逐渐趋于平均, 使得整个网络的知识传播速率下降。本文将这种现象称为知识的“海绵效应”。

6.4 隐性知识传播系统仿真模拟结果定量分析

出于计算精度的考虑, 这里选取t=40时刻, 知识增量与学习速率同二维评价指标和其下10维数据之间的回归分析, 如表9所示。通过R语言中的多元线性回归函数lm, 前后进行两次多元线性回归后分析得出的结论是: 知识增量与知识能力指数和传播能力指数都有很强的关系。其中, 提问数量(question)、赞同数(agree)和出度(degree.out)对于知识增量的影响力 最大。

表9   多元线性回归参数

   

回归系数t值p值
知识能力指数0.80203.0900.00278
传播影响力指数1.20397.1065.22e-10
answer0.0026761.0020.31996
question0.050652.6540.00984
article0.037141.5670.12166
agree0.000030781.8080.07494
topic-0.05145-1.2570.21310
betweeness0.011360.0560.95585
degree.out1.5211.8880.06313
degree.in-0.6753-0.9810.33001
degree.total1.13640.6160.54021
shole1.0881.1490.25456

新窗口打开

基于多元线性回归的初步结论, 认为网络问答社区内, 用户通过多提问题、多关注高质量用户和浏览他人的动态、多回答高质量问题, 可以明显地提升自身的知识量。

提问是一种积极与其他用户交互的过程, 在“知乎”这样的问答社区中, 提问是用户获取知识的最重要的方式之一。通过提问, 用户会自发整理自身的知识, 这本身就是对自身知识的一种回顾, 不仅可以温习以往知识, 还可以锻炼用户的语言表达能力和促进用户的思维发展。而且, 这种获取知识的方式比较直接, 用户可以直接通过网络问答社区邀请话题优秀回答者获得自身想要的答案, 相对于在海量的网络资源中检索效率较高。

关注高质量用户是一种积极获取外界知识的途径。在“知乎”中用户关注高质量的用户后便可以在自身首页的动态中了解其他用户最新了解的知识, 在一定程度上可以为用户带来许多新鲜的知识。通过关注来增强与外界接触也是“知乎”此类网络问答社区的主要功能之一, 可以及时更新前沿知识。

回答高质量问题是用户外化自身隐性知识最好的途径之一。用户可以通过回答问题温故自身的旧知识, 同时还可以锻炼自身的语言表达能力。此外, 其他用户的问题也可以变相激发用户对于某一问题的认知, 加深用户对问题的理解并赋予知识创新的机会, 对知识自增长有着尤为重要的影响。

7 结 语

为了研究网络问答社区的知识传播机制和学习效用, 本文选取“知乎”作为研究对象。获取“知乎”海量的用户信息, 基于这些信息, 遴选出80位意见领袖, 并通过意见领袖之间的相互关注关系构建社会网络关系矩阵和社会网络关系图。结合R语言, 分析此社会网络具备高聚集系数、低平均路径长度的小世界特征, 并采用中间中心度、点度中心度、结构洞等指标衡量网络中的节点影响力。为了更好地分析节点的性质, 本文使用相关性分析和层次聚类的方式降低数据维度, 并通过熵权法加权求和的方式得到用户的知识能力指数和传播影响力指数; 依据Cowan模型构建隐性知识传播动力学模型, 并且结合用户的知识能力指数对用户知识传播和知识学习效果进行系统仿真。通过系统仿真结果发现: 知识存量越少的节点在网络中的学习效率越高, 而具备适当知识存量但存量依然较低的节点在网络中的知识存量增长倍数最大, 本文将这种现象称之为知识的“海绵效应”。此外, 为了避免对知识的疲倦, 用户应及时更新关注网络中的新兴权力节点, 从而使得自身的学习效果处于更好的状态。为了保持良好的学习状态, 用户可以通过多提问题、多关注高质量用户和浏览他人的动态、多回答高质量问题来提升自身的知识量。

本文研究存在一些问题: 关于传播动力学模型的假设, 未考虑到网络动态的随机重连。未来可以通过对邻接矩阵数值的随机概率变化和增加新节点等方式将网络动态化。

作者贡献声明

王忠义: 提出研究思路;

张鹤铭: 设计研究方案, 分析数据, 进行实验, 起草论文;

黄京: 采集、清洗数据;

李春雅: 论文最终版本修订。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: wzywzy13579@163.com。

[1] 王忠义, 张鹤铭. user-info.xlsx. 知乎42万用户原始数据.

[2] 王忠义, 张鹤铭. 80user.xlsx. 80位意见领袖关系矩阵、特征描述和影响力分析数据.


参考文献

[1] 韦勇娇.

认知盈余时代, 网络问答社区的知识传播模式探析——以“知乎”为例

[J]. 广西职业技术学院学报, 2014, 7(1): 30-34, 40.

URL      [本文引用: 2]      摘要

知乎依靠精英与专家相结合的路线、高质量的问答、理性友好的讨论氛围等核心竞争力在众多网络问答社区中脱颖而出,成为中国现存问答类网站中的佼佼者,它的知识传播模式引起了笔者的关注。本文将从内容与推广两个维度对知乎的运营方式进行观察和归纳,试图探析认知盈余时代下知识传播的新模式。

(Wei Yongjiao.

Analysis of Modes of Knowledge Dissemination Online Q&A——A Case Study of Zhihu Q&A Website

[J]. Journal of Guangxi Vocational and Technical College, 2014, 7(1): 30-34, 40.)

URL      [本文引用: 2]      摘要

知乎依靠精英与专家相结合的路线、高质量的问答、理性友好的讨论氛围等核心竞争力在众多网络问答社区中脱颖而出,成为中国现存问答类网站中的佼佼者,它的知识传播模式引起了笔者的关注。本文将从内容与推广两个维度对知乎的运营方式进行观察和归纳,试图探析认知盈余时代下知识传播的新模式。
[2] 吕峰.

基于隐马尔科夫模型的问答社区用户知识贡献意愿研究[D]

. 哈尔滨: 哈尔滨工业大学, 2015.

[本文引用: 1]     

(Lv Feng.

Research on the Knowledge Contribution Intention in Q&A Community Based on Hidden Markov Model[D]

. Harbin: Harbin Institute of Technology, 2015.)

[本文引用: 1]     

[3] 金家华.

社会化问答社区中用户知识行为的影响因素研究[D]

. 哈尔滨: 哈尔滨工业大学, 2015.

[本文引用: 1]     

(Jin Jiahua.

Research on the Influence Factors of User’s Knowledge Activities in Online Social Q&A Community[D]

. Harbin:Harbin Institute of Technology, 2015.)

[本文引用: 1]     

[4] 陈娟, 高杉, 邓胜利.

社会化问答用户特征识别与行为动机分析——以“知乎”为例

[J]. 情报科学, 2017, 35(5): 69-74, 80.

URL      [本文引用: 1]      摘要

【目的/意义】对“知乎”用户进行分类,识别不同类别的用户特征,并对其问答行为进行分析。【方法/过程】运用火车头采集器抓取社会化问答平台用户个人特征与行为的客观数据共计475636个,运用R语言进行样本分离,对三类子样本构建回归模型进行分析。【结果/结论】Questionjover组用户的行为动机以求知动机与利他动机为主;Answer_lover组用户表现较符合社交型用户特点;Majority组用户具有很强的享受帮助、兴趣动机和社交动机,该组男性用户在问答行为上显著活跃于女性用户,但这种差异在其他两组并不显著。

(Chen Juan, Gao Shan, Deng Shengli.

Characteristics Recognition and Motivation Analysis of Social Q&A Users——A Case Study of ‘Zhihu’ Website

[J]. Information Science, 2017, 35(5): 69-74, 80.)

URL      [本文引用: 1]      摘要

【目的/意义】对“知乎”用户进行分类,识别不同类别的用户特征,并对其问答行为进行分析。【方法/过程】运用火车头采集器抓取社会化问答平台用户个人特征与行为的客观数据共计475636个,运用R语言进行样本分离,对三类子样本构建回归模型进行分析。【结果/结论】Questionjover组用户的行为动机以求知动机与利他动机为主;Answer_lover组用户表现较符合社交型用户特点;Majority组用户具有很强的享受帮助、兴趣动机和社交动机,该组男性用户在问答行为上显著活跃于女性用户,但这种差异在其他两组并不显著。
[5] 黄梦婷, 张鹏翼.

社会化问答社区的协作方式与效果研究: 以知乎为例

[J]. 图书情报工作, 2015, 59(12): 85-92.

https://doi.org/10.13266/j.issn.0252-3116.2015.12.013      URL      [本文引用: 1]      摘要

[目的/意义]以知乎为例,探讨在线问答社区用户之间的协作发起和响应、协作内容的类型以及效果是否存在差异。[方法/过程]对知乎"健康"话题精华下观点探讨、个人建议、事实陈述3类问题20个答案及2 287条评论中的220例协作进行内容分析,比较不同协作的差异。[结果/结论](1)在协作发起动作中,提问与质疑两类动作占据70%-80%,观点探讨类"提出质疑"的发起动作比例更高,且交互性较强的发起动作更能获得回应;(2)协作多发生于作者与评论者之间;(3)共13种交互类型对答案的8个指标有提升效果,尤其能显著提升答案的完整性、细节性和信息量。

(Huang Mengting, Zhang Pengyi.

Collaboration Forms and Effectiveness in Social Q&A Communities: A Case Study of Zhihu.com

[J]. Library and Information Service, 2015, 59(12): 85-92.)

https://doi.org/10.13266/j.issn.0252-3116.2015.12.013      URL      [本文引用: 1]      摘要

[目的/意义]以知乎为例,探讨在线问答社区用户之间的协作发起和响应、协作内容的类型以及效果是否存在差异。[方法/过程]对知乎"健康"话题精华下观点探讨、个人建议、事实陈述3类问题20个答案及2 287条评论中的220例协作进行内容分析,比较不同协作的差异。[结果/结论](1)在协作发起动作中,提问与质疑两类动作占据70%-80%,观点探讨类"提出质疑"的发起动作比例更高,且交互性较强的发起动作更能获得回应;(2)协作多发生于作者与评论者之间;(3)共13种交互类型对答案的8个指标有提升效果,尤其能显著提升答案的完整性、细节性和信息量。
[6] 刘佩, 林如鹏.

网络问答社区“知乎”的知识分享与传播行为研究

[J]. 图书情报知识, 2015(6): 109-119.

https://doi.org/10.13366/j.dik.2015.06.109      URL      [本文引用: 2]      摘要

本文以新兴的知识问答与分享社区——知乎网为研究对象,采取内容分析和社会网络分析相结合的方法,深入探讨网络问答社区内用户的知识传播与知识分享行为并得出三个结论:首先是整体网呈现一个典型的"小世界"网络关系,其节点呈幂律分布;其次社区成员参与讨论所扮演的角色鲜明,点入度较高的成员比较有声望,能够吸引更多的人和其讨论交流。点出度高的成员则习惯于阅读答案以及和其他人进行讨论提问,他们是知识建构的促进者和知识共享的受益者。最后从内容上而言,社交问答网站问题呈现更多元化,回答部分内容更加个性化以及偏重社交功能。

(Liu Pei, Lin Rupeng.

Research on Knowledge Sharing and Dissemination Behavior of Online Q&A Services: Taking Zhihu as an Example

[J]. Documentation, Information & Knowledge, 2015(6): 109-119.)

https://doi.org/10.13366/j.dik.2015.06.109      URL      [本文引用: 2]      摘要

本文以新兴的知识问答与分享社区——知乎网为研究对象,采取内容分析和社会网络分析相结合的方法,深入探讨网络问答社区内用户的知识传播与知识分享行为并得出三个结论:首先是整体网呈现一个典型的"小世界"网络关系,其节点呈幂律分布;其次社区成员参与讨论所扮演的角色鲜明,点入度较高的成员比较有声望,能够吸引更多的人和其讨论交流。点出度高的成员则习惯于阅读答案以及和其他人进行讨论提问,他们是知识建构的促进者和知识共享的受益者。最后从内容上而言,社交问答网站问题呈现更多元化,回答部分内容更加个性化以及偏重社交功能。
[7] Liu Z, Jansen B J.

Questioner or Question: Predicting the Response Rate in Social Question and Answering on Sina Weibo

[J]. Information Processing & Management, 2018, 54(2): 159-174.

https://doi.org/10.1016/j.ipm.2017.10.004      URL      [本文引用: 1]      摘要

With the noted popularity of social networking sites, people increasingly rely on these social networks to address their information needs. Although social question and answering is potentially an important venue seeking information online, it, unfortunately, suffers from a problem of low response rate, with the majority of questions receiving no response. To understand why the response rate of social question and answering is low and hopefully to increase it in the future, this research analyzes extrinsic factors that may influence the response probability of questions posted on Sina Weibo. We propose 17 influential factors from 2 different perspectives: the content of the question, and the characteristics of the questioner. We also train a prediction model to forecast a question's likelihood of being responded based on the proposed features We test our predictive model on more than 60,000 real-world questions posted on Weibo, which generate more than 600,000 responses. Findings show that a Weibo's question answerability is primarily contingent on the questioner versus the question . Our findings indicate that using appreciation emojis can increase a question's response probability, whereas the use of hashtags negatively influences the chances of receiving answers. Our contribution is in providing insights for the design and development of future social question and answering tools, as well as for enhancing social network users collaboration in supporting social information seeking activities.
[8] Jin J, Li Y, Zhong X, et al.

Why Users Contribute Knowledge to Online Communities: An Empirical Study of an Online Social Q&A Community

[J]. Information & Management, 2015, 52(7): 840-849.

https://doi.org/10.1016/j.im.2015.07.005      URL      [本文引用: 1]      摘要

Based on social capital theory, social exchange theory, and social cognitive theory, this study explored why users continuously contribute knowledge to online social Q&A communities. Empirical panel count data were collected from a popular Chinese online social Q&A community. The results from a negative binomial regression model with user fixed effects indicate that a user's self-presentation, peer recognition, and social learning have a positive impact on his knowledge-contribution behaviors. The findings can help guide the development and operation of online social Q&A communities.
[9] Lou J, Fang Y, Lim K H, et al.

Contributing High Quantity and Quality Knowledge to Online Q&A Communities

[J]. Journal of the Association for Information Science and Technology, 2013, 64(2): 356-371.

[本文引用: 1]     

[10] 左遥, 梁英, 毕晓迪, .

社会化问答网站知识传播网络推断方法

[J]. 计算机学报, 2018, 41(1): 82-97.

URL      [本文引用: 1]     

(Zuo Yao, Liang Ying, Bi Xiaodi, et al.

An Inference Method of Knowledge Diffusion Network in Community Question Answering Sites

[J]. Chinese Journal of Computers, 2018, 41(1): 82-97.)

URL      [本文引用: 1]     

[11] 宁菁菁.

基于“弱关系理论”的知识问答社区知识传播研究——以知乎网为例

[J]. 新闻知识, 2014(2): 98-99,50.

https://doi.org/10.3969/j.issn.1003-3629.2014.02.038      URL      [本文引用: 1]      摘要

互联网是当今社会知识传播的重要渠道,良好的知识传播网络能够形成良好的知识传播氛围。知乎网是以知识共享为核心,期望以关系社区形式帮助用户获取问题和答案的网络问答社区。本文使用“弱关系理论”分析知乎网的传播机制,认为知乎网用户获取和贡献的知识是多元化的,并且更多的是跨学科的知识。知乎网中的隐性知识传播具有开放性的特点。用户的自我效能、利他心理、成员感知的乐趣、工作时间等,与知识贡献的程度呈现显著的相关关系。并且奖赏激励制度的缺失,对成员的知识贡献并没有呈现负面影响。

(Ning Jingjing.

Research on Knowledge Communication in Knowledge Q&A Community Based on “Weak Relationship Theory”—— A Case Study of Zhihu Network

[J]. News Research, 2014(2): 98-99, 50.)

https://doi.org/10.3969/j.issn.1003-3629.2014.02.038      URL      [本文引用: 1]      摘要

互联网是当今社会知识传播的重要渠道,良好的知识传播网络能够形成良好的知识传播氛围。知乎网是以知识共享为核心,期望以关系社区形式帮助用户获取问题和答案的网络问答社区。本文使用“弱关系理论”分析知乎网的传播机制,认为知乎网用户获取和贡献的知识是多元化的,并且更多的是跨学科的知识。知乎网中的隐性知识传播具有开放性的特点。用户的自我效能、利他心理、成员感知的乐趣、工作时间等,与知识贡献的程度呈现显著的相关关系。并且奖赏激励制度的缺失,对成员的知识贡献并没有呈现负面影响。
[12] Cowan R, Jonard N.

Network Structure and the Diffusion of Knowledge

[J]. Journal of Economics Dynamics and Control, 2004, 28(8): 1557-1575

https://doi.org/10.1016/j.jedc.2003.04.002      URL      [本文引用: 1]      摘要

This paper models knowledge diffusion as a barter process in which agents exchange different types of knowledge. This is intended to capture the observed practice of informal knowledge trading. Agents are located on a network and are directly connected with a small number of other agents. Agents repeatedly meet those with whom direct connections exist and trade if mutually profitable trades exist. In this way knowledge diffuses throughout the economy. We examine the relationship between network architecture and diffusion performance. We consider the space of structures that fall between, at one extreme, a network in which every agent is connected to nearest neighbours, and at the other extreme a network with each agent being connected to, on average, randomly chosen agents. We find that the performance of the system exhibits clear mall world properties, in that the steady-state level of average knowledge is maximal when the structure is a small world (that is, when most connections are local, but roughly 10 percent of them are long distance). The variance of knowledge levels among agents is maximal in the small world region, whereas the coefficient of variation is minimal. We explain these results as reflecting the dynamics of knowledge transmission as affected by the architecture of connections among agents.
[13] Matlab [K/OL]. [2018-04-13].https://www.mathworks.com/.

[本文引用: 1]     

[14] 王嘉.

思想政治教育视域下的网络意见领袖研究[D]

. 大连: 大连理工大学, 2013.

[本文引用: 1]     

(Wang Jia.

Researches on Network Opinion Leader for Ideological and Political Education [D]

. Dalian: Dalian University of Technology, 2013.)

[本文引用: 1]     

[15] 赵基明, 邱均平, 黄凯, .

一种新的科学计量指标——h指数及其应用述评

[J]. 中国科学基金, 2008(1): 23-32.

https://doi.org/10.3969/j.issn.1000-8217.2008.01.005      URL      [本文引用: 1]      摘要

由J.E.Hirsch于2005年提出的h指数是一个很有创意的新的科学计量评价指标。本文介绍了h指数的定义、优势及其在科学研究人员、科研集体和学术期刊绩效评价等方面的应用情况,对h指数的局限性作了中肯评述,并建议在有关重要学术评价中予以适当采用。

(Zhao Jiming, Qiu Junping, Huang Kai, et al.

A New Scientometric Indicator——Review on h Index and Its Application

[J]. Bulletin of National Natural Science Foundation of China, 2008(1): 23-32.)

https://doi.org/10.3969/j.issn.1000-8217.2008.01.005      URL      [本文引用: 1]      摘要

由J.E.Hirsch于2005年提出的h指数是一个很有创意的新的科学计量评价指标。本文介绍了h指数的定义、优势及其在科学研究人员、科研集体和学术期刊绩效评价等方面的应用情况,对h指数的局限性作了中肯评述,并建议在有关重要学术评价中予以适当采用。
[16] Rstudio [K/OL]. [2018-04-13]..

URL      [本文引用: 1]     

[17] 汪小帆, 李翔, 陈关荣. 网络科学导论[M]. 北京: 高等教育出版社, 2012: 233.

[本文引用: 1]     

(Wang Xiaofan, Li Xiang, Chen Guanrong.Network Science: An Introduction[M]. Beijing: Higher Education Press, 2012: 233.)

[本文引用: 1]     

[18] Tan P-N, Steinbach M, Kumar V.数据挖掘导论(完整版) [M]. 范明, 范宏建等译. 北京: 人民邮电出版社, 2011: 38-39.

[本文引用: 1]     

(Tan P-N, Steinbach M, Kumar V.Introdution to Data Mining[M]. Translated by Fan Ming, Fan Hongjian, et al. Beijing: Post & Telecom Press, 2011: 38-39.)

[本文引用: 1]     

[19] 张继国, 辛格. 信息熵——理论与应用[M]. 北京: 中国水利水电出版社, 2012:1-2.

[本文引用: 2]     

(Zhang Jiguo, Singh V P.Information Entropy——Theory and Application[M]. Beijing: China Water & Power Press, 2012: 1-2.)

[本文引用: 2]     

[20] 芦白茹, 张坤严, 心娥, .

基于AHP法和熵权法组合权重对RC结构危险房屋多层次模糊综合评定研究

[C]. 见: 第25届全国结构工程学术会议论文集, 2016: 89.

[本文引用: 2]     

(Lu Bairu, Zhang Kuyan, Xin E, et al.

Multi-hierarchy Fuzzy Comprehensive Assessment of RC Structure Dangerous Buildings Based on Combined Weights of AHP and Entropy-weighted Method

[C]// Proceedings of the 25th National Conference on Structural Engineering. 2016: 89.)

[本文引用: 2]     

[21] Shannon C E.

A Mathematical Theory of Communication

[J]. Bell System Technical Journal, 1948, 27(3): 379-423.

https://doi.org/10.1002/j.1538-7305.1948.tb01338.x      URL      [本文引用: 1]      摘要

on this subject. In the present paper we will extend the theory to include a number of new factors, in particular the effect of noise in the channel, and the savings possible due to the statistical structure of the original message and due to the nature of the final destination of the information.
[22] Kermack W O, McKendrick A G.

Contributions to the Mathematical Theory of Epidemics. II.—The Problem of Endemicity

[J]. Proceedings of the Royal Society of London A, 1932, 138(834): 55-83.

https://doi.org/10.1098/rspa.1932.0171      URL      [本文引用: 1]     

[23] 李中师.

基于个体差异的复杂网络下隐性知识传播模型研究[D]

. 杭州: 浙江工业大学, 2012.

[本文引用: 1]     

(Li Zhongshi.

Study of Tacit Knowledge Transfer Based on Individual Differences in Complex Social Networks[D]

. Hangzhou: Zhejiang University of Technology, 2012.)

[本文引用: 1]     

[24] 张红兵. 虚拟企业知识转移的研究[M]. 北京: 经济管理出版社, 2009: 56.

[本文引用: 1]     

(Zhang Hongbing.Research on the Knowledge Transfer in Virtual Enterprise[M]. Beijing: Economics & Management Publishing House, 2009: 56.)

[本文引用: 1]     

[25] 汪应洛. 系统工程[M]. 第4版. 北京: 机械工业出版社, 2008: 82.

[本文引用: 1]     

(Wang Yingluo. System Engineering[M]. The 4th Edition. Beijing: China Machine Press, 2008: 82.)

[本文引用: 1]     

/