学术博客共推荐关系及核心结构特性研究 ——以科学网博客为例
谭旻1, 许鑫2, 赵星1
1浙江大学信息资源管理系 杭州 310027
2华东师范大学商学院信息学系 上海 200241

许鑫, ORCID: 0000-0001-7020-3135, E-mail: xxu@infor.ecnu.edu.cn。
摘要
目的

讨论共推荐这一结合信息推荐与信息共现的信息行为概念。

方法

以学术博客为考察场景, 科学网博客为应用实例, 利用网络分析方法探索性地研究共推荐关系在学术博客中的实证特性。

结果

实证结果显示, 相对于其他类型网络, 科学网博客中的共推荐关系具有高聚集性、行为活跃、强度均衡等结构特点; 在核心-边缘结构的分析中, 网络以节点群体作为网络核心; 在核心节点群体内部, 节点之间体现一定的均衡性。【局限】共推荐行为在不同应用领域中有不同动机和功用, 本文仅基于科学网学术博客社区进行实证。

结论

学术博客研究中, 共推荐关系可作为一种新的行为研究视角, 其在核心结构上体现出更为平等的特性。

关键词: 学术博客; 社会媒体; 共推荐; 核心-边缘结构; h子网
中图分类号:
Exploring the Co-recommendation Relationship and Its Core Structure Features of Academic Blogs——Taking ScienceNet.cn Blog as an Example
Tan Min1, Xu Xin2, Zhao Xing1
1 Department of Information Resource Management, Zhejiang University, Hangzhou 310027, China
2 Department of Information Science, Business School, East China Normal University, Shanghai 200241, China

Abstract

[Objective] Try to combine information recommendation and co-occurrence into a new informational relation, namely information co-recommendation in online academic blogs. [Methods] Taking ScienceNet.cn Blog as an example, use network analysis as the basis of quantitative analysis to explore the features of co-recommendation in academic blogs. [Results] The empirical research of ScienceNet.cn Blog shows that compared to the other types of networks, the case has the structural characteristics of high cohesiveness, active interaction and balanced strength; the network takes node group as the network core, and the relative balance occurs in the core group. [Limitations] Co-recommendations have different motivations and functions in different application fields. However, this paper only gives an empirical research on ScienceNet.cn. [Conclusions] The co-recommendation can be an option for future studies of academic blogs. This behavior presents more equality in the structure.

Keyword: Academic; blogs; Social; media; Co-recommendation; Core-Periphery; structure; h-subnet
1 引 言

学术博客可理解为一类以学术内容为主要议题的网络信息聚合, 其中所涉及的信息关联既表征信息组织结构, 又反映信息(知识)流动路径, 极具研究价值。对于信息关联的研究也一直是情报学的重要议题, 典型研究主题包括信息推荐与信息共现。

信息推荐是近年信息领域中的研究热点。推荐关系可理解为推荐实体A对被推荐实体B在某种程度上的关注、认同或褒扬, 是一种直接的信息关联。学术博客中, 推荐亦是常见的技术功能与信息行为。博客中的信息推荐通常表示博主A阅读了B发布的信息内容, 并以推荐表达认同。或者是A对B存有信任, 认为其信息值得推广, 故而推荐。信息推荐行为在社会与商业系统中广泛存在, 常被构建为推荐网络(Recommender Networks)[1, 2]进行研究, 在电子商务等领域发挥着独具特色的商业价值[3, 4, 5]

信息共现作为一种信息关系, 体现了不同信息实体共同出现于同一信息内容或行为中的现象。情报学中较早的共现研究出现于信息检索中的关键词共现[6, 7], 之后在元数据[8]、文献计量[9]、文献聚合[10]、语义检索[11]等多个主题上都有扩展。共引(Co- citation)是共现关系在信息检索之外被提及最多的概念[12, 13, 14]。当两篇论文同时被第三篇文献所引用时, 即说明这两篇论文之间存在内容上的学术关联, 而这种学术关联并非一定是显性的主题相关, 由此, 共引可能启发出学术上的交叉创新。与推荐行为相同, 共现也可抽象为共现网络进行定量研究, 从而深入研究这类相对隐性的信息行为关系。

信息推荐与信息共现都是常见的信息行为, 前者指代直接、显性的推荐关联, 而后者表述相对间接、隐性的共现关系。实际在学术博客中, 这两种关系都有较多体现, 特别是两种关系另有结合探索的可能。本文尝试在学术博客中讨论共推荐(Co- Recommendation)这一新型的信息行为关系, 从而将推荐与共现的直接与间接信息相结合, 给出新的学术博客研究视域。本文将对共推荐关系进行理论分

析, 以网络分析为定量方法, 以科学网博客作为实证样本, 探索共推荐关系在学术博客中具有的实证特性。

2 共推荐关系

将信息推荐关系与信息共现关系相结合, 可抽取出共推荐关系这一交叉型信息行为关系。当两个不同实体A和B都推荐了第三个实体C, 即可认为A与B之间具有共推荐关系。在推荐的意义上, A和B都同时做出推荐行为。在共现的意义上, A和B都同时出现在C的推荐来源中。可见, 共推荐关系隐含了推荐与共现两种行为信息, 可描述为两个不同实体共同推荐第三个实体这一行为关联。共推荐隐含的行为关联体现了两个不同实体之间具有相似的意愿、偏好与信息表达通道。在学术博客中, 两位不同博主都推荐了另一位博主(或其发布的博文内容), 说明这两位博主之间存在兴趣相关点或知识交流的可能性, 而共推荐关系可抽取出这一可能性。

在理论上, 共推荐关系描述了实体之间的共同关注行为, 是比推荐关系更深层次的测度视域。推荐表示单向的、直接的显性信息流, 而共推荐表征双向的、间接的隐性信息流。如图1所示, 在机理上, 共推荐关系由推荐转化而得。当构成网络时, 推荐的网络具有方向, 而共推荐的网络没有方向。两种关系都带有权重[15], 且测度意义明显: 推荐权重表示信息关注或流动强度, 共推荐权重表征信息关联或近似强度。若网络中两个节点之间有高强度的共推荐关系, 表明它们某一特性方面具有较强类似性, 例如, 有近似信息行为, 或表现出类似信息偏好。若某一实体处于关系结构上的中心, 则其可能是影响整体网络推荐走向的意见领袖, 这一实体的推荐将能联动其他节点的一致推荐。

图1 由推荐关系抽取出共推荐关系

在方法上, 主要由社会网络分析和复杂网络研究构成的网络分析方法是现今研究关系的最佳范式之一。故共推荐关系也可用网络分析方法进行深刻的定量探索。由共推荐关系构成的网络在网络类型上的基本特点包括:

(1) 形成带权网, 权重为共推荐次数, 有重要测度价值;

(2) 形成无向网, 即共推荐无方向之分, 联系两端对等;

(3) 形成对称阵, 即网络矩阵中上半阵与下半阵完全对称。此外, 对角线元素通常为0, 即一般不存在“ 自我共现” 的情况。

在学术博客的应用上, 若两位博主同时推荐了第三位博主(发布的博客内容), 即会出现在第三位博主(发布的博客内容)的推荐列表中, 通过对推荐列表的抽取分析, 即可整理出该博客内容中的共推荐关系, 合并一定范围内的相关共推荐关系, 即可得到某一博客社群中的共推荐关系集合, 从而进行进一步的研究或应用。共推荐关系对学术博客功能开发亦有启发意义, 当博主之间有高强度的共推荐关系时, 系统可开发相应功能作为好友或相关博主的一种推荐标准, 从而将隐性联系变为显性链接, 帮助促进交叉创新交流。笔者利用科学网博客这一典型学术博客社区, 对共推荐关系的实证特性进行基础性的探索, 供今后深入的研究和应用参考。

3 实例研究
3.1 数 据

本文基础数据为2013年科学网博客的全年数据[16, 17]。具体的数据采集与处理操作如下:

(1) 2013年1月至2014年2月期间, 采用网络爬虫程序持续采集科学网博客2013全年的整体数据。数据收集至2014年2月主要是因为2013年年底的博文在2014年初仍有较多推荐更新。

(2) 从上述整体数据中, 抽取博主、博文和推荐等关键信息。其中推荐信息从博文页面内容抓取。

(3) 由提取的推荐关系信息构建共推荐关系及其强度(共推荐次数)。

(4) 根据样本规模和共推荐关系强度特点(整年数据时间跨度较大, 共推荐数偏低的可能是偶发性行为), 选择共推荐数不少于20的博主(博客)为研究样本。

(5) 以样本博主为节点, 博主之间的共推荐关系为联系, 构建出科学网络博客的共推荐关系网络。结果网络中包含220位博主, 体量规模在社会性网络中处于适中范畴。

3.2 方 法

本文采用网络分析方法对共推荐关系及其网络进行定量探索。网络分析的基本逻辑是: 以图论和矩阵运算为数理基础, 将实体作为节点, 实体间联系作为关系, 进而集成为网络, 从结构的视角去理解实体间的关系[5]。除使用基础网络分析方法外, 本研究实证部分还将重点观察社会性网络中广泛出现的“ 核心-边缘” 现象, 运用社会网络分析中的核心-边缘分析[18]与信息网络分析中新近提出的h子网(h-subnet)方法[19]

核心-边缘分析是一种识别社会系统中核心节点与边缘节点二分现象的网络分析方法, 在信息分析中亦有使用[20, 21]。此方法依据节点之间的连接密度, 将网络内的节点分为少数的核心节点与多数的边缘节点两个群体。其中核心节点间保持相对紧密的联系, 而边缘节点之间存有相对稀松的联系。计算思路为: 根据节点的核心度, 对所有节点分别运算, 用非标准化Pearson相关系数进行模型拟合程度计算, 使得核心节点间关系强度高, 而边缘节点间关系强度低。

h子网方法是专门用于信息类网络分析的新方法, 基础算法来源于引文评价中h指数, 可用于抽取网络中高强度的核心群体, 具有本学科特色[19]。网络的h子网的计算基础是h强度(h-strength), h强度的数值即为网络中强度不低于h的联系数量。由此, 一个网络的h子网可描述为: 强度大于或等于网络h强度的联系、以及通过这些联系连接的节点所构成的子网络(计算过程如图2所示)。由定义和图2可见, h子网抽取的是网络中的高强度核心子群, 在学术博客中, 能挖掘出相互共推荐关系紧密的博主群体。h子网方法与核心-边缘分析在思路上都可用于测度网络中的核心子群, 但核心-边缘分析侧重结构二分, h子网注重高权联系。另一个本质差别是, 核心-边缘分析是为无权网络而设计, 而h子网专用于带权网络。

图2 h子网计算抽取过程示例[19]

3.3 实证讨论

基于以上数据和方法, 可对科学网博客的共推荐关系进行探索性研究。经过网络分析计算, 得到网络中博主的共推荐关系基本参量, 如表1所示:

表1 科学网博客共推荐关系特征基本统计参量

表1体现了案例网络中的共推荐行为较活跃。 2013年内220位样本博主的平均节点联系数量约为52, 平均与网络中近四分之一的其他博主都有共推荐行为。节点的联系数量也等于无权网络中的节点度, 案例博客网络的这一指标高于文献[22]中给出的27种现实网络中的24种, 仅低于社会网络中的演员网络、信息网络中的单词组配网络和技术网络中的铁路网络。值得注意的是, 这些平均联系数量较高的网络都是无向网络。就社会网络而言, 心理学已有深刻阐释的互惠性[23]是无向的双边关系频繁构建的重要动力之一。而共推荐网络中, 大量共推荐关系的建立则更多地取决于信息内容或兴趣相似性。案例共推荐网络的高密度不仅体现于联系数量方面, 其节点距离约1.5也低于众多实际网络[22], 但接近于文献[24]中给出的关键词共现网络(1.654-1.960), 短的节点距离或许是部分信息共现类网络的共性。短距离有利于信息的快速交互与关联, 而互联网应用的重要价值正是淡化物理距离和降低关联成本。较多的节点联系和较短的节点距离将带来网络整体的高凝聚性, 案例网络的网络聚集系数也高于文献[22]总结的27种现实网络中的26种, 仅低于社会网络中的公司董事网络, 这一结果说明, 博客不仅拥有相对自由平等的表达渠道, 而且能够极大节约交流成本, 从而其共推荐关系得以在更高的信息对称水平上体现出更显著的“ 物以类聚” 。

推荐关系具体到博客中, 可表达博主对于博文所承载信息内容一定程度的关注与认同, 抑或是对于博文发布者本身的信任与倾慕。在此基础上的共推荐行为, 则表示两位共推荐博主在信息内容关注、认同与偏好上存在某方面的共通性。由前述比较分析可见, 案例网络是一个具有高凝聚性、互动频繁同时具有相对均衡性的特色信息网络。

从而可以推测, 案例在网络结构上应具有高密度和连接紧密的特点, 在中心性上应体现博主群体作为中心的趋势。图3的科学网博主共推荐关系的主体结构可视化支持了这一论点。可见, 网络中的共推荐联系众多, 结构复杂, 而网络中的显著节点本身差距不大, 相互连接十分紧密, 构成群体性的核心。其中, 节点大小表示节点带权度, 联系粗细表示联系强度。为避免遮盖, 图3仅显示强度不低于10的联系及相连节点。

图3 科学网博主共推荐关系的主体结构可视化

为验证图3的定性推论, 采用核心-边缘分析对案例整体网络进行定量测算, 结果发现: 案例网络符合核心-边缘的社会性网络基本假设, 网络被分为由38个核心节点和182个边缘节点构成的二分结构。然而, 38个核心节点的绝对数量并不低, 初步体现出群体性核心的特征。因核心-边缘分析是针对无权网络设计, 而共推荐关系中的联系强度具有显著测度意义, 需要重点把握。因此, 在用核心-边缘分析作为初步探索之后, 重点采用专为带权信息联系设计的h子网方法进一步探索, 如图4所示。

图4 案例网络的h子网结构

h子网方法[19]即从网络中提取强度不低于h的联系及其相连结构, 构成复杂网络的简化高权子群。在联系强度具有明确测度意义的网络中, 也可代表一种视角的核心子网。图4(a)为气泡图, 气泡大小表示横纵轴博主节点对应的联系强度; 图4(b)为h子网全部节点与联系, 节点大小表示节点带权强度。由图4可见, 与核心-边缘分析的结果总体一致, h子网从联系强度的视角, 也给出了陈安等16位博主共同组成网络的核心群体。案例网络的h子网节点多为资深学者, 例如李小文、武夷山等, 这些学者之间存在紧密的共推荐关系。

由h子网内部结构进一步测算, 群体内虽然也有共推荐强度相对高的节点, 但与其他节点的强度差异在网络分析中不突出。陈安和赵美娣等节点虽然联系众多, 但各节点之间的联系强度(图4(a))差别甚小。从而得到结论: 案例网络中, 共推荐关系构成一个主要的群体性核心, 且核心的内部差别相对较

小, 具有一定的均衡性与平均性。在案例相关的共推荐关系中, 各博主在推荐时, 受其他节点的影响相对较小, 而具有相当的独立性与多样性。此结果的部分原因是因为案例网络构建于科学网这一以学者为主的社区。相比以流行文化和新闻娱乐为主的新浪微博等社会媒体, 科学网中的学者们更能在独立精神与从众心理中寻求到客观平衡。这一结果也充分显示, 学术博客作为一个平等交流的学术性网络渠道, 可为各学科学者自由、广泛地交换学术思想提供更通畅的平台, 而不必拘泥于传统学术交流中的“ 小同行困境” 与“ 权威性约束” 。学术博客作为网络学术交流的一种代表, 有望成为传统学术交流的重要补充, 在平等性与开放性上体现出特殊的信息渠道价值。

4 结 语

本研究以学术博客为研究对象, 结合推荐行为与图书情报学中长期关注的共现现象, 提出共推荐关系这一隐含信息行为概念。采用科学网博客这一社会媒体为具体研究案例, 从网络整体特征、核心-边缘结构的角度, 实证探索了共推荐关系的定量特征。结果显示, 案例共推荐网络具有相对高聚集性的结构特点; 共推荐行为活跃; 节点与联系强度相对均衡; 网络核心节点以群体形态出现, 并在核心群体内表现联系强度的平等性。

当然, 样本仅来自于科学网博客, 故只能构成探索性的研究, 更多的实证数据仍有待进一步挖掘和深化。共推荐关系是随着网络信息发展演化而成的新型信息行为, 前期研究较少, 特别是理论模型仍有待发展, 下一步研究可考虑将其与信息共现理论结合深化。无论是推荐行为还是共推荐行为, 在不同的场景可能会有不同的含义, 本研究的背景是学术博客, 然而在更广泛的系统中, 如电子商务、娱乐博客中, 共推荐关系如何体现和利用, 将是值得深入探索的议题。

共推荐关系作为一类隐含的网络信息关系, 可表征实体之间未必互知的信息关联, 从而成为联系不同信息内容、构建创新性信息渠道的切入点。对于学术博客等互联网应用而言, 共推荐关系也可作为观测用户关联, 推荐信息内容或关联对象的功能开发依据。

参考文献
[1] Newman M E J. Networks: An Introduction [M]. Oxford: Oxford University Press, 2010. [本文引用:1]
[2] Clauset A. Finding Local Community Structure in Networks [J]. Physical Review E, 2005, 72(2): No. 026132. [本文引用:1]
[3] Adomavicius G, Tuzhilin A. Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(6): 734-749. [本文引用:1] [JCR: 1.815]
[4] L, Medo M, Yeung C H, et al. Recommender Systems[J]. Physics Reports-Review Section of Physics Letters, 2012, 519(1): 1-49. [本文引用:1]
[5] Pathak B, Garfinkel R S, Gopal R D, et al. Empirical Analysis of the Impact of Recommender Systems on Sales[J]. Journal of Management Information Systems, 2010, 27(2): 159-188. [本文引用:2] [JCR: 1.925]
[6] Small H G. Relationship Between Citation Indexing and Word Indexing—Study of Co-occurrences of Title Words and Cited References[J]. Proceedings of the American Society for Information Science, 1973, 10: 217-218. [本文引用:1]
[7] Van Rijsbergen C J. A Theoretical Basis for the Use of Co-occurrence Data in Information Retrieval[J]. Journal of Documentation, 1977, 33(2): 106-119. [本文引用:1]
[8] Zhang J, Jastram I. A Study of Metadata Element Co-occurrence[J]. Online Information Review, 2006, 30(4): 428-453. [本文引用:1] [JCR: 1.443]
[9] Su H N, Lee P C. Mapping Knowledge Structure by Keyword Co-occurrence: A First Look at Journal Papers in Technology Foresight[J]. Scientometrics, 2010, 85(1): 65-79. [本文引用:1] [JCR: 2.274]
[10] 邱均平, 王菲菲. 基于共现与耦合的馆藏文献资源深度聚合研究探析[J]. 中国图书馆学报, 2013, 39(3): 25-33.
(Qiu Junping, Wang Feifei. An Exploration of In-depth Aggregation of Library Document Resources Based on Co-occurrence and Coupling[J]. Journal of Library Science in China, 2013, 39(3): 25-33. ) [本文引用:1] [CJCR: 4.075]
[11] Lou W, Qiu J P. Semantic Information Retrieval Research Based on Co-occurrence Analysis[J]. Online Information Review, 2014, 38(1): 4-23. [本文引用:1] [JCR: 1.443]
[12] Egghe L, Rousseau R. Co-citation, Bibliographic Coupling and a Characterization of Lattice Citation Networks[J]. Scientometrics, 2002, 55(3): 349-361. [本文引用:1] [JCR: 2.274]
[13] Yan E, Ding Y. Scholarly Network Similarities: How Bibliographic Coupling Networks, Citation Networks, Cocitation Networks, Topical Networks, Coauthorship Networks, and Coword Networks Relate to Each Other[J]. Journal of the American Society for Information Science and Technology, 2012, 63(7): 1313-1326. [本文引用:1] [JCR: 2.23]
[14] Zhao S X, Ye F Y. Power-law Link Strength Distribution in Paper Cocitation Networks[J]. Journal of the American Society for Information Science and Technology, 2013, 64(7): 1480-1489. [本文引用:1] [JCR: 2.23]
[15] Zhao S X, Ye F Y. Exploring the Directed H-degree in Directed Weighted Networks[J]. Journal of Informetrics, 2012, 6(4): 619-630. [本文引用:1]
[16] 徐孝娟, 赵宇翔, 朱庆华. 民族志决策树方法在学术博客用户行为中的研究——以科学网博客为例[J]. 现代图书情报技术, 2014(1): 79-86.
(Xu Xiaojuan, Zhao Yuxiang, Zhu Qinghua. Explore User’s Behavior of Academic Blog Based on EDTM: Take Blog. Sciencenet as an Example[J]. New Technology of Library and Information Service, 2014(1): 79-86. ) [本文引用:1]
[17] 周春雷, 朱向林. 科学网图情博客发展现状研究[J]. 图书情报知识, 2013(5): 98-105.
(Zhou Chunlei, Zhu Xianglin. Study on LIS Blogs in Science Net[J]. Document, Informaiton & Knowledge, 2013(5): 98-105. ) [本文引用:1]
[18] Borgatti S P, Everett M G. Everett, Models of Core/Periphery Structures[J]. Social Networks, 1999, 21(4): 375-395. [本文引用:1]
[19] Zhao S X, Zhang P L, Li J, et al. Abstracting the Core Subnet of Weighted Networks Based on Link Strengths[J]. Journal of the Association for Information Science and Technology, 2014, 65(5): 984-994. [本文引用:3]
[20] Zelnio R. Identifying the Global Core-Periphery Structure of Science[J]. Scientometrics, 2012, 91(2): 601-615. [本文引用:1] [JCR: 2.274]
[21] Amrit C, van Hillegersberg J. Exploring the Impact of Socio-Technical Core-Periphery Structures in Open Source Software Development[J]. Journal of Information Technology, 2010, 25(2): 216-229. [本文引用:1] [JCR: 3.789]
[22] Newman M E J. The Structure and Function of Complex Networks[J]. SIAM Review, 2003, 45(2): 167-256. [本文引用:1] [JCR: 4.791]
[23] 邹文篪, 田青, 刘佳. “投桃报李”——互惠理论的组织行为学研究述评[J]. 心理科学进展, 2012, 20(11): 1879-1888.
(Zou Wenchi, Tian Qing, Liu Jia. “Give a Plum in Return for a Peach”: A Review of Reciprocity Theory of Organizational Behavior[J]. Advances in Psychological Science, 2012, 20(11): 1879-1888. ) [本文引用:1] [CJCR: 1.35]
[24] 叶鹰, 张力, 赵星, . 用共关键词网络揭示领域知识结构的实验研究[J]. 情报学报, 2012, 31(12): 1245-1251.
(Ye F Y, Zhang P L, Zhao S X, et al. An Experimental Study on Revealing Domain Knowledge Structure by Co- keyword Networks[J]. Journal of the China Society for Scientific and Technical Information, 2012, 31(12): 1245-1251. ) [本文引用:1] [CJCR: 1.098]