数据分析与知识发现, 2019, 3(2): 13-20
doi: 10.11925/infotech.2096-3467.2018.0424
基于计划行为理论的微博用户转发行为影响因素研究*
Examining Reposts of Micro-bloggers with Planned Behavior Theory
席林娜, 窦永香

摘要:

【目的】探究微博用户转发行为的影响因素。【方法】基于计划行为理论, 考虑微博所传达情感及微博平台的时间线机制对于用户转发行为的影响, 提出研究假设并对其进行验证。【结果】用户情感与微博情感相似度、粉丝量均对微博用户转发行为具有显著影响, 微博时间线机制对于用户转发行为几乎没有影响。【局限】对于用 户的登录时间采用统一时间节点。【结论】本研究结果对于网络舆情控制、个性化推荐、微博广告营销具有借鉴意义。

关键词: 计划行为理论 ; LDA主题模型 ; 用户行为分析

Abstract:

[Objective] This paper tries to explore the influencing factors of Microblog (Weibo) user’s reposting behaviors. [Methods] Based on the theory of planned behavior, we evaluted the sentiment of Weibo users and the impacts of the Weibo timeline on users’ reposting behaviors. [Results] The degree of similarity between the real world and online sentiments of Weibo users’, as well as the number of followers had significant impacts on Weibo user’s reposting behaviors. The timeline feature posed little effect to the user’s reposting behaviors. [Limitations] Only examined users logging in Weibo at a specific time. [Conclusions] This study could improve the performance of public opinion management, personalized recommendation, and advertising campains on Weibo.

Key words: Theory of Planned Behavior ; LDA Topic Model ; User Behavior Analysis

1 引 言

社交网络服务(Social Networking Service, SNS)为舆情信息的传播提供了一个新平台, 构成以网民为节点的舆情传播网。在中国, 微博已成为广大民众获取信息的渠道之一, 根据《第42次中国互联网络发展状况统计报告》显示, 截至2018年6月, 微博用户规模较2017年末增长了6.8%[1]。微博作为一个集信息发布和传播于一体的社会化媒体平台, 其用户可以不受时间、空间限制对某条信息进行发布及评论, 使得信息在短时间内通过网络或被关注或被转发, 也可能进一步发展为社会舆论事件。转发行为作为微博用户传播消息的重要手段, 也是网络舆论事件发酵的一个主要途径。因此, 分析微博用户的转发行为, 对于网络舆情控制、个性化推荐、微博广告营销均具有一定的参考作用。

本文选定新浪微博用户作为研究对象, 基于计划行为理论从行为态度、主观规范以及感知行为控制三个方面提出研究假设, 并利用二元逻辑回归模型对假设进行验证。

2 文献综述

用户行为是近年来的研究热点, 关于用户行为影响因素或动机方面的研究主要集中在以下三个方面:

(1) 基于用户特征属性。用户兴趣、突发新闻及朋友的推文这三方面的影响因素被用于Twitter用户转发行为的预测[2]; 性别也会影响用户进行信息实时分享的行为[3]; 用户的权威性、用户偏好及用户的社会关系作为影响因素被用于微博用户转发行为的预测[4]; 转发活跃度、用户兴趣、交互度均对微博用户转发行为具有显著影响[5]; 基于用户个性化的内容兴趣偏好, 文献[6]通过SVM方法预测了单个用户是否会转发某条微博。

(2) 基于微博网络拓扑结构。针对微博用户的关注网络, 概率级联模型被用来预测给定微博主题的转发路径 [7]; 社会网络分析方法被用来研究网络舆情传播路径[8]; 改进的SEIR网络模型结合贝叶斯算法可以实现对转发路径的预测[9]; 活跃邻居节点对用户转发意愿具有一定影响[10]; 针对微博中存在不同的传播模式, 文献[11]对网络中强势节点和桥节点的作用进行了分析。

(3) 基于微博内容特征。标签、URL等诸多因素是用户转发行为的主要影响因素[12]; 微博包含Hashtag、图片、视频以及@符号等是否会影响用户的转发行为[13]; 微博内容的长度在一定程度上对用户转发行为具有影响[7]; 微博消息内容的重要性也是影响用户转发行为的重要因素[14]

用户转发微博的一个目的是传播信息, 所以该过程可以看作信息传播过程。信息传播过程中包括三个要素: 信源、信道、信宿。据此, 目前关于微博用户转发行为的研究主要围绕用户或者微博文本内容展开, 即主要针对信息传播过程中的“信源”及“信宿”进行研究。微博平台作为用户发生转发行为的载体, 也是信息传播过程中的“信道”。由于微博平台的时间线机制, 用户看到的微博往往是最新发布的内容, 部分微博由于被淹没而不能被用户浏览。现有研究中, 关于微博平台的时间线机制对微博用户转发行为影响的研究较少; 而在用户偏好方面则主要考虑用户兴趣对转发行为的影响, 但地震发生后网民转发大量祈福博文传递正能量, 说明情感也是用户行为的驱动因素。

微博用户转发行为受个体意愿以及微博平台时间线机制内外两方面因素影响, 而计划行为理论考虑个体及外界因素, 对于不完全受个人意志力控制的行为具有较好的解释力。因此, 本文基于计划行为理论, 分别从行为态度、主观规范及感知行为控制三个方面研究微博用户转发行为的影响因素, 并基于二元逻辑回归对假设进行验证。

3 模型构建与假设
3.1 计划行为理论

理性行为理论认为个体的行为可通过行为意向判断, 而行为意向则是由个体对行为的态度和主观规范共同决定的[15]。但由于理性行为理论中关于行为意向主要受行为个体意志影响的假设, 导致其适用范围受到一定限制[16]。因此, Ajzen在理性行为理论的基础上提出计划行为理论, 认为人的行为不仅受到行为态度及主观规范影响, 还受到个人所掌握的机会、资源等, 即“感知行为控制”的影响[17]

计划行为理论是管理学和社会学等领域广泛应用的行为理论, 也是个体行为学研究领域的基础理论。顾东晓等基于计划行为理论分别从自我实现需要、沉浸需要、主观规范和感知行为控制4个方面研究互联网用户链接分享行为的影响因素[18]。李颖琦等通过对计划行为理论的修正, 构建虚拟学习社区中知识共享的影响因素模型[19]。王星辰基于该理论对社会化问答网站知识共享因素进行研究[20]。Seari等对计划行为理论进行扩展, 分别从描述性规范、风险和信任三个方面分析Facebook用户隐私保护行为的影响因素[21]

行为态度是个人对于采取某项行为所持有的正面或者负面态度, 在微博中一方面表现为用户是否喜欢转发微博; 另一方面则为用户是否对该条微博感兴趣, 即用户对于微博内容是否喜欢或该条微博能否引起用户情感上的共鸣。主观规范是个体对于是否采取某项特定行为所感受到的来自社会的压力。在微博中, 与用户有直接社会关系的是该用户的关注者以及粉丝。感知行为控制是个体对于采取某项特定行为难易程度的感知, 反映的是个体对促进或阻碍行为表现因素的掌握程度, 如信息、机会、障碍等。在微博中主要表现为微博消息的发布时间是否落入用户登录微博的时间区间内, 如果微博消息不能及时地出现在用户登录微博的时间区间内, 则认为用户对于转发该条微博所掌握的机会较小, 因此转发的可能性相对较低。

3.2 研究假设

依据计划行为理论, 本文从行为态度、主观规范、感知行为控制三个方面构建微博用户转发行为影响因素模型, 如图1所示。

图1 微博用户转发行为影响因素模型

(1) 行为态度

计划行为理论中, 人的行为意向受行为态度影响。在微博中, 用户的行为态度主要受以下三方面因素的影响:

①用户对于该平台“转发”功能的态度;

②用户对于接收到的微博消息所传达内容的态度;

③用户对于接收到的微博消息所传达情绪或者情感的态度。

用户对于微博平台“转发”功能的态度取决于用户过去是否经常性或者习惯性地转发微博消息。为了吸引粉丝, 有些用户热衷于转发各种微博, 用户的行为特征会影响用户转发行为[22]。在本研究中, 利用用户一定时间段内的转发活跃度衡量其对“转发”功能的态度。综上, 提出H1假设:

H1: 用户转发活跃度越高, 其发生转发行为的可能性越大。

用户对于微博消息所传达内容的态度即对微博内容是否感兴趣, 用户往往希望看到并转发自己感兴趣的内容[23]。在本研究中, 使用用户兴趣与微博文本的语义相似度衡量用户对该条微博内容感兴趣的程度。综上, 提出H2假设:

H2: 用户兴趣与微博文本的语义相似度越高, 其发生转发行为的可能性越大。

用户对于微博消息所传达情感的态度即微博消息所传达情感与用户想要表达情感的接近程度, 微博信息共享的一个重要动机是释放即时激发的情绪[24]。在本研究中, 将用户个人情感极性与微博内容所传达情感极性的相似度作为衡量标准。综上, 提出H3假设:

H3: 用户情感与微博文本所传达的情感相似度越高, 其发生转发行为的可能性越大。

(2) 主观规范

计划行为理论中, 人的行为意向受主观规范影响。在微博中, 用户行为受到与其具有重要关系的人的影响, 因此, 主观规范对于微博用户的影响主要有两个方面: 作为接收用户, 受到与上游用户亲密度的影响; 作为发布用户, 受到下游粉丝的影响。

有研究表明, 用户更容易受到与自己紧密相关的“小圈子”影响[25]。在本研究中, 采取用户与上游用户的交互度衡量彼此之间的亲密程度。综上, 提出H4假设:

H4: 用户与上游用户之间的交互度越高, 其发生转发行为的可能性越大。

作为发布用户, 还会受到下游粉丝对其行为的影响。廖海涵等发现用户粉丝数量与微博数量具有相关性[26]。综上, 提出H5假设:

H5: 用户粉丝量越大, 其发生转发行为的可能性越大。

(3) 感知行为控制

计划行为理论中, 人的行为意向还受到感知行为控制的影响。在微博平台中, 用户是否转发某条微博还取决于用户是否可以及时浏览到该条微博。在本研究中, 利用微博对于用户可见与否衡量用户能否及时浏览到该条微博消息。综上, 提出H6假设:

H6: 微博对于用户可见, 该用户发生转发行为的可能性越大。

4 模型中测量变量的表示
4.1 用户兴趣与微博文本语义相似度

在本研究中, 用户兴趣通过微博用户近期发布的微博内容获得, 基于LDA主题模型分别训练待预测微博文本及用户近期发布的微博文本, 得到微博文本及用户兴趣的主题概率分布。由于微博内容长度一般较短, 若将单条微博内容单独应用到LDA主题模型中, 会存在主题稀疏问题。因此, 采用文献[23]的方法, 将用户所有微博合成为一个文本, 得到的主题分布就是用户兴趣的主题分布, 通过JS距离[27]计算待预测微博文本与用户兴趣的相似度, 计算方法如公式(1)和公式(2)所示。

${{D}_{js}}(p,q)=\frac{1}{2}[{{D}_{kl}}(p,\frac{p+q}{2})+{{D}_{kl}}(q,\frac{p+q}{2})]$ (1)

${{D}_{kl}}=\underset{i}{\mathop \sum }\,p(i)\ln \frac{p(i)}{q(i)}$ (2)

其中, p(i)表示微博文本主题概率分布, q(i)表示用户兴趣主题概率分布。

4.2 用户情感与微博情感相似度

通过基于情感词典的方法分别计算待预测微博及用户微博的情感值(正代表积极, 负代表消极, 零代表中性), 以待预测微博与用户微博情感值的平均距离计算两者之间的情感相似度$D(x,y)$, 计算方法如公式(3)所示。

$D(x,y)=\frac{1}{\frac{\mathop{\sum }_{1}^{n}\sqrt{{{\left( x-{{y}_{i}} \right)}^{2}}}}{n}+1}$ (3)

其中, n代表观测期用户微博的数量, x代表待预测微博文本情感值, yi代表微博用户第i条微博的情感值。

4.3 转发活跃度

用户转发活跃度$A(u)$反映用户在微博平台中使用微博“转发”功能的参与程度。本研究以用户在观测期转发微博数量占其微博总数的比例来确定, 如公式(4)所示。

$A(u)=\frac{{{N}_{r}}}{N}$ (4)

其中, Nr代表用户在观测时间段内转发微博的数量, N代表该时间段内用户发布的微博总数。

4.4 与上游用户交互度

用户与上游发布用户的交互度$I(i,j)$具体表现为观测期接收用户对发布用户的微博内容进行转发、评论、点赞的频次。计算方法如公式(5)所示。

$I(i,j)=\frac{{{R}_{ij}}+{{C}_{ij}}+{{Z}_{ij}}}{T}$ (5)

其中, ${{R}_{ij}}$, ${{C}_{ij}}$, ${{Z}_{ij}}$分别代表观测期接收用户j对发布用户i的微博内容进行转发、评论、点赞的次数, T代表观测时间长度。

4.5 粉丝量

根据用户粉丝量进行离散化处理, 分为5个不同的级别: 粉丝量在[0,100]记为1, (100,1000]记为2, (1000,10000]记为3, (10000,100000]记为4, 100000以上记为5。

4.6 微博对于用户可见与否

本研究利用用户发布微博的时间近似表示用户登录微博的时间。根据文献[28]统计结果可知, 用户24小时的发帖行为符合作息规律, 每天11点、15点、22点发帖量达到高峰, 因此选定这三个时间节点作为用户登录微博的时间。

已有研究发现: 50%的转发行为发生在1小时以内, 75%发生在一天以内[29]。由于微博内容以时间倒序显示在用户界面中, 用户关注数量越大, 微博内容更新速度越快, 因此微博内容在用户界面停留的时间窗口$\Delta t$与用户关注量有关, 关注量越大, 时间窗口越短。因此设置时间窗口分别为15分钟、30分钟、1小时、10小时和24小时, $\Delta t$的计算如公式(6)和公式(7)所示。

$\begin{align} & \Delta t=15\times \phi ({{N}_{f}}-200)+30\times \phi ({{N}_{f}}-100)\times \phi (200-{{N}_{f}}) \\ & \ \ \ \ \ \ \ +60\times \phi ({{N}_{f}}-50)~\times (100-{{N}_{f}}) \\ & \ \ \ \ \ \ \ +10\times 60\times \phi ({{N}_{f}}-20)\times (50-{{N}_{f}}) \\ & \ \ \ \ \ \ \ +24\times 60\times (20-{{N}_{f}})\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ {{\ }^{{}}}\mathrm{(6)} \\ \end{align}$

$\phi (x)=\left\{ \begin{matrix} 1\ \ x\ge 0 \\ 0\ \ x<0 \\\end{matrix} \right.$ (7)

如果微博的发布时间落入时间区间[t-Δt, t+t1], 则代表微博内容对于用户可见, 记为“1”, 否则记为“0”。t代表用户登录微博的时间点, t1代表用户使用微博的时长, 在此t1统一设定为30分钟。

5 假设验证及结果分析
5.1 实验数据

本研究选取新浪微博平台, 利用网络爬虫工具八爪鱼抓取新浪微博数据。随机挑选部分用户作为种子用户, 获取这些种子用户2017年11月5日-2017年12月5日的微博、微博转发用户及能够接收到这些微博的非转发用户, 进行用户去重并过滤掉部分垃圾用户, 得到有效用户集合U。获取用户集合U中每个用户近期发布的微博, 用于提取用户兴趣及获取用户情感倾向。对于获取到的数据集, 根据用户实际转发情况进行人工标记, 最终得到54 462条实验数据。

在进行微博文本主题概率分布计算及情感分析前, 需要对文本进行加工处理。因此在实验前有必要做如下预处理:

(1) 分词: 利用Python自带Jieba分词包对微博文本进行分词;

(2) 去停用词: 根据停用词集合(哈尔滨工业大学停用词表、四川大学机器智能实验室停用词表和百度停用词表), 整理得到综合的停用词表对微博文本实现去停用词处理。

5.2 二元逻辑回归模型

本文主要研究微博用户转发行为的影响因素, 用户行为包括两种: 转发、不转发。转发行为作为因变量, 即0-1型变量, 将“转发”记为Y=1, “不转发”记为Y=0。解释变量主要包括用户兴趣与微博文本语义相似度、转发活跃度、与上游用户交互度、粉丝量、用户情感与微博情感相似度以及微博对于用户可见与否, 具体描述如表1所示。

表1 自变量描述

自变量的部分计算结果如表2所示, 部分用户数据如表3所示。

表2 部分自变量计算结果

表3 部分用户数据

5.3 结果及分析

利用SPSS 20.0中的二元逻辑回归进行模型 分析, 从模型运行结果来看, Nagelkerke R方值 为0.581, 说明模型整体拟合情况比较好, 如表4所示。

表4 模型汇总

根据模型估计结果, 对微博用户转发行为有显著影响的因素包括用户兴趣与微博文本语义相似度、与

上游用户交互度、转发活跃度、粉丝量、用户情感与微博情感相似度, 如表5所示。

表5 方程中的变量

本文所有假设的验证结果如表6所示。

表6 假设验证结果

用户的转发活跃度反映了用户对于微博平台“转发”功能的使用频率, 经常性转发微博的用户更容易发生转发行为, 研究结果支持H1假设。用户兴趣与微博文本的语义相似度反映了用户对于微博内容喜好的程度, 用户对微博内容更感兴趣时更容易发生转发行为, 研究结果支持H2假设。用户情感与微博情感的相似度反映了该微博内容与用户想要传达情感的接近程度, 相似度越高, 用户更容易转发, 研究结果支持H3假设。与上游用户的交互度反映了用户与发布用户的亲密程度, 用户更容易转发与自己相对亲近的人的微博内容, 研究结果支持H4假设。

H5假设用户粉丝量越多, 用户转发微博的可能性越大, 研究结果并不支持该假设。微博中某些用户转发微博是为了提供更多的信息而进一步吸引其他用户关注, 因此粉丝量越小的用户, 发生转发行为的可能性越大。粉丝量反映用户在微博中的受欢迎程度, 也是用户权威性的表现, 而权威用户发布的微博中, 原创微博占比相对较大。所以, 相比于用户的粉丝量, 转发活跃度更能反映用户是否会发生转发行为。

H6假设微博对于用户可见更容易被其转发, 研究结果不支持该假设。本研究通过微博发布时间是否落入用户使用微博的时间区间来判断微博对于用户可见与否。通过对数据集的观察发现, 用户未发生转发行为的原因之一是微博内容与自己兴趣的相似度极低, 即并不是用户感兴趣的内容。所以, 即使用户浏览到某一条微博, 也会考虑到自己的兴趣来选择是否转发。

6 结 语

本文分析用户在微博平台中的转发行为, 基于计划行为理论从行为态度、主观规范及感知行为控制三个方面提出研究假设, 分别以用户兴趣与微博文本的语义相似度、转发活跃度、用户情感与微博情感相似度、与上游用户交互度、粉丝量和微博对于用户可见与否作为微博用户转发行为的影响因素, 最后基于二元逻辑回归模型对研究假设进行验证。研究结果发现, 行为态度因素中, 用户兴趣与微博文本语义相似度、用户情感与微博情感相似度和转发活跃度均对微博用户转发行为具有显著影响; 主观规范因素中, 用户与上游用户的交互度和用户粉丝量对用户转发行为影响显著; 感知行为控制因素中, 微博对于用户可见与否对用户转发行为影响不显著, 即微博的时间线机制对用户是否转发微博几乎没有影响。

本研究的不足之处主要是对用户登录微博的时间采用统一时间节点, 在未来研究中可以进一步基于用户日志获取每个用户登录微博的时间及用户使用微博时长等, 更加真实准确地刻画每个用户的行为特征, 深入分析用户行为。另外, 在进行情感相似度计算时,没有考虑到微博中丰富的表情符号所传达的情感,未来可以综合表情符号及微博文本的情感进一步研究微博用户转发行为的影响因素。

作者贡献声明

窦永香: 提出研究思路, 设计研究方案, 修改论文;

席林娜: 采集、清洗数据, 完成实验并分析结果, 撰写论文。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: 359481115@qq.com。

[1] 席林娜. 微博用户转发行为影响因素. zip. 所有微博用户数据.

参考文献

[1] 中国互联网络信息中心. 第42次中国互联网发展状况统计报告[R]. 北京: 中国互联网络信息中心, 2018.
[本文引用:1]
(China Internet Network Information Center. The 42nd Statistical Report on Internet Development in China[R]. Beijing: China Internet Network Information Center, 2018. )
[2] Xu Z, Zhang Y, Wu Y, et al.Modeling User Posting Behavior on Social Media[C]// Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2012: 545-554.
[本文引用:1]
[3] Wang C, Zhou Z, Jin X, et al.The Influence of Affective Cues on Positive Emotion in Predicting Instant Information Sharing on Microblogs: Gender as a Moderator[J]. Information Processing and Management, 2017, 53(3): 721-734.
Instant information sharing on microblogs is important for promoting social awareness, influencing customer attitudes, and providing political and economic benefits. However, research on the antecedents and mechanisms of such instant information sharing is limited. To address that issue, this study develops a research model to investigate the factors (affective cues in particular) that drive users to instantly share information on microblogs and explores the moderating role of gender. An online survey was conducted on a microblogging platform to collect data for testing the proposed research model and hypotheses. The results confirm the positive effects of informational (i.e., information uniqueness), ambient (i.e., information crowding), and social (i.e., social interactivity) cues on individuals positive emotion, which subsequently promotes their urge to share information on microblogs. Moreover, the moderating effects of gender are identified. This study contributes to the understanding of instant information sharing from an impulsive behavior perspective. The results also provide important insights for service providers and practitioners who wish to promote instant information sharing on microblogs.
DOI:10.1016/j.ipm.2017.02.003      URL     [本文引用:1]
[4] Song G, Li Z, Tu H.Forward or Ignore: User Behavior Analysis and Prediction on Microblogging[C]// Proceeding of the 25th International Conference on Industrial Engineering and Other Applications of Applied Intelligent System. 2012: 231-241.
[本文引用:1]
[5] 陈姝, 窦永香, 张青杰. 基于理性行为理论的微博用户转发行为影响因素研究[J]. 情报杂志, 2017, 36(11): 147-152.
[目的/意义]基于理性行为理论分析微博用户转发行为,考虑了微博语义特征、数据形式、用户特征、用户交互等因素,探究了影响用户态度和主观规范的因素对用户转发行为的影响。[方法/过程]在分析微博特征、用户特征及用户转发行为的基础上,基于理性行为理论提出研究假设,采用主题建模的技术研究文本的语义信息,基于LDA进行微博文本与用户兴趣的概率主题分布的训练,基于二元Logistic回归模型对提出的影响因素完成数据验证。[结果/结论]态度因素中,接收用户活跃度、微博文本与用户兴趣的语义相似度对用户转发行为影响显著,微博数据形式对用户转发行为影响不显著;主观规范因素中,发布用户与接收用户交互度对用户转发行为影响显著,发布用户的影响力对用户转发行为影响不显著。研究成果在用户行为预测、微博传播分析等领域可借鉴使用。
DOI:10.3969/j.issn.1002-1965.2017.11.023      URL     [本文引用:1]
(Chen Shu, Dou Yongxiang, Zhang Qingjie.Research on the Influential Factors of the Reposting Behavior of Microblog Users Based on the Theory of Reasoned Action[J]. Journal of Intelligence, 2017, 36(11): 147-152.)
[6] 李志清. 基于LDA主题特征的微博转发预测[J]. 情报杂志, 2015, 34(9): 158-162.
微博转发是微博传播的重要途径,也是研究微博信息传播、舆情监控的最关键问题之一。研究用户转发行为对信息传播分析、舆情监控和热点提取有很大帮助。然而,当前对微博转发行为的研究大多是在宏观层面,为了解决微观层面预测用户转发行为问题,在分析影响用户转发的各类因素基础上,首先构建了微博特征和用户特征,然后通过将LDA抽取的微博隐含主题特征,与微博特征和用户特征相结合建立起基于主题特征的微博预测模型。实验结果验证了该模型在微博转发行为预测的有效性。
DOI:10.3969/j.issn.1002-1965.2015.09.030      URL     [本文引用:1]
(Li Zhiqing.Predicting Retweeting Behavior Based on LDA Topic Features[J]. Journal of Intelligence, 2015, 34(9): 158-162.)
[7] 曹玖新, 吴江林, 石伟, . 新浪微博网信息传播分析与预测[J]. 计算机学报, 2014, 37(4): 780-789.
文中以新浪微博为研究对象,以分析新浪微博的信息转发与传播特征为研究目的,并对传播行为进行预测。在获取大量新浪微博在线数据的基础上,对各种可能影响用户转发行为的因素进行统计、分析,挖掘各种影响因素特征并进行建模。提出基于用户属性、社交关系和微博内容三类综合特征,使用机器学习的分类方法,对给定微博的用户转发行为进行预测。基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据。文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响,并验证了传播预测的有效性。
DOI:10.3724/SP.J.1016.2014.00779      URL     [本文引用:2]
(Cao Jiuxin, Wu Jianglin, Shi Wei, et al.Sina Microblog Information Diffusion Analysis and Prediction[J]. Chinese Journal of Computers, 2014, 37(4): 780-789.)
[8] 王晰巍, 邢云菲, 赵丹, . 基于社会网络分析的移动环境下网络舆情信息传播研究——以新浪微博“雾霾”话题为例[J]. 图书情报工作, 2015, 59(7): 14-22.
[Objective] More and more users information consume and spread network public opinion in the mobile context as the number of mobile user is increasing. The analysis of the public news opinion’s propagation path and law plays an important role for relevant departments to strengthen their supervision of public opinion.[Method] In this paper, on the theoretical level, using social network analysis method as the theoretical basis, from the point of degree centrality, betweenness centrality and closeness centrality attributes of three, analyze the network public opinion dissemination of information in mobile terminal compared to non-mobile terminal under the topic of “haze” .In the aspect of application, subject to haze for example, obtaining sina.com.cn data using Locoyspider, the use of Gephi software and mathematical statistical analysis tools to draw on the chart to do simulation analysis. [Result] The results reveal the characteristics of network public opinion dissemination in mobile environment and verify the validity of social network analysis in this study .The result also provides a new perspective for the research on the propagation theory of network public opinion information and an analysis tool for the practice of network public opinion supervision level under mobile environment.
DOI:10.13266/j.issn.0252-3116.2015.07.002      URL     [本文引用:1]
(Wang Xiwei, Xing Yunfei, Zhao Dan, et al.The Study of Network Public Opinion Dissemination with Social Network Analysis Under the Mobile Environment: A Case of “Haze” in Sina Micro- blog[J]. Library and Information Service, 2015, 59(7): 14-22.)
[9] 郭淼, 焦垣生. 网络舆情传播与演变背景下的微博信息转发预测分析[J]. 情报杂志, 2016, 35(5): 46-51.
[目的/意义]针对新时期微博平台的舆情传播特点,研究复杂社交网络下的微博用户转发行为的预测模型。[方法/过程]研究了网络中个体状态在改进SEIR网络模型的数学表达以及评价个体传播能力的改进PageRank算法,利用数值仿真对改进SEIR模型进行了验证。并利用该文提出的模型对6.20南京宝马肇事案的新浪微博数据进行了分析。[结果/结论]改进SEIR模型相比于传统SEIR模型更好地预测了复杂社交网络的网络舆情传播,同时改进PageRank算法能够很好地评价用户的传播能力,结合贝叶斯网络能够较好预测微博转发路径与转发次数。
DOI:10.3969/j.issn.1002-1965.2016.05.009      URL     [本文引用:1]
(Guo Miao, Jiao Yuansheng.Predictive Analysis of Micro-blog Information Forwarding Under the Background of Network Public Opinion Dissemination and Evolution[J]. Journal of Intelligence, 2016, 35(5): 46-51.)
[10] 李倩, 张碧君, 赵中英. 微博信息转发影响因素研究[J]. 软件导刊, 2017, 16(1): 15-17.
基于社会化媒体数据研究信息的传播及预测,是当前网络舆情分析的一大热点。以 Twitter 数据为研究对象,以探寻影响信息转发的因素为研究目的,设计算法分析活跃邻居节点数对转发行为的影响,提出3种活跃邻居节点结构并验证三者对转发行为的影响程度,运用重启动的随机游走算法研究回复与提及关系对转发行为的影响。在Twitter数据集上实现了该算法,证明了活跃邻居节点数、活跃邻居节点结构、回复与提及关系对转发行为的影响。
DOI:10.11907/rjdk.162452      URL     [本文引用:1]
(Li Qian, Zhang Bijun, Zhao Zhongying.Research on the Influencing Factors of Microblog Information[J]. Software Guide, 2017, 16(1): 15-17.)
[11] 刘继, 李磊. 基于微博用户转发行为的舆情信息传播模式分析[J]. 情报杂志, 2013, 32(7): 74-77.
对网络舆情传播模式中单关键点型、多关键点型、链式型传播模式进 行分析,对网络结构中的强势节点和桥节点的作用进行了讨论。针对不同主题的微博信息传播进行了实证分析,发现单关键点型传播模式以强势节点为主,没有桥节 点支持,传播链一般较短,但传播速度快;多关键点型传播中多个强势节点通过桥节点进行信息交互,传播影响大;链式型传播模式由于缺乏强势节点,信息传播扩 散能力较弱,但传播层次较深。
DOI:10.3969/j.issn.1002-1965.2013.07.015      URL     [本文引用:1]
(Liu Ji, Li Lei.Analysis of Public Opinion Propagation Mode Based on Repost Behavior of Microblog Users[J]. Journal of Intelligence, 2013, 32(7): 74-77.)
[12] Suh B, Hong L, Pirolli P, et al.Want to be Retweeted? Large Scaleanalytics on Factors Impacting Retweet in Twitter Network[C]// Proceedings of the 2nd International Conference on Social Computing. IEEE, 2010: 177-184.
[本文引用:1]
[13] 唐晓波, 罗颖利. 融入情感差异和用户兴趣的微博转发预测[J]. 图书情报工作, 2017, 61(9): 102-110.
[目的J意义]微博转发是实现微博信息传播的重要方式,对用户转发行为进行研究可以更好地理解微博信息传播机制,对热点话题检测、舆情监控、微博营销等具有重要意义。针对以往研究中用户兴趣表示不够全面准确以及未考虑情感差异对用户转发行为的影响,提出一个融入情感差异和用户兴趣的微博转发预测模型。[方法/过程]该模型首先从维基百科中提取概念语义关系构建维基知识库,将其作为语义知识源对微博文本进行语义扩展,解决语义稀疏问题;对语义扩展后的用户历史微博进行聚类,提取用户兴趣主题和主题对用户的影响力;然后计算微博中各类情感的情感强度,提取情感差异特征;最后结合用户行为特征、用户交互特征、微博特征、用户兴趣特征和情感差异特征,运用SVM实现微博转发预测。[结果J结论]在新浪微博真实数据集上进行实验,验证了所提模型的有效性。
DOI:10.13266/j.issn.0252-3116.2017.09.013      URL     [本文引用:1]
(Tang Xiaobo, Luo Yingli.Integrating Emotional Divergence and User Interests into the Prediction of Microblog Retweeting[J]. Library and Information Service, 2017, 61(9): 102-110.)
[14] 李英乐, 于洪涛, 刘力雄. 基于SVM的微博转发规模预测方法[J]. 计算机应用研究, 2013, 30(9): 2594-2597.
为了评价微博的传播效果,在分析影响用户转发行为因素的基础上,提出了采用用户影响力、用户活跃度、兴趣相似度、微博内容重要性和用户亲密程度五项特征进行转发行为预测的SVM算法,以及基于该算法的转发规模预测算法。最后给出了传播规模预测的评价方法。针对新浪微博用户数据的实验表明,预测精度达到了86.63%。
DOI:10.3969/j.issn.1001-3695.2013.09.008      URL     [本文引用:1]
(Li Yingle, Yu Hongtao, Liu Lixiong.Predict Algorithm of Micro-Blog Retweet Scale Based on SVM[J]. Application Research of Computers, 2013, 30(9): 2594-2597.)
[15] Ajzen I.From Intentions to Actions: A Theory of Planned Behavior[A]// Kuhl J, Beckmann J. Action Control: From Cognition to Behavior[M]. New York: Springer-Verlag, 1985: 11-39.
[本文引用:1]
[16] Madden T J, Ellen P S, Ajzen I.A Comparison of the Theory of Planned Behavior and the Theory of Reasoned Action[J]. Personality and Social Psychology Bulletin, 1992, 18(1): 3-9.
ABSTRACT Research in social psychology has extensively referenced and used Fishbein and Ajzen's theory of reasoned action to predict and understand motivational influences on behavior Recently Ajzen has proposed an extension of the theory by including perceptions of behavioral control as an additional predictor of intentions and behavior. The present research compared Ajzen's theory of planned behavior with the theory of reasoned action for 10 behaviors chosen to represent a range with respect to control over performing the behavior. he results indicate that inclusion of perceived behavioral control enhances the prediction of behavioral intention and behavior Consistent with the theory of planned behavior, the effects of perceived behavioral control on a target behavior are most vivid when the behavior presents some problem with respect to control.
DOI:10.1177/0146167292181001      URL     [本文引用:1]
[17] Ajzen I.Theroy of Planned Behavior[J]. Organizational Behavior and Human Decision Processes, 1991, 50(2): 179-217.
No abstract is available for this item.
DOI:10.1016/0749-5978(91)90020-T      URL     [本文引用:1]
[18] 顾东晓, 孙建军, 张悦, . 基于计划行为理论的用户链接分享研究[J]. 运筹与管理, 2016, 25(2): 173-179.
基于计划行为理论梳理分析了移动互联网用户链接分享行为的影响因素,构建了各影响因素与网络用户链接行为关系的概念模型,并基于428条现实世界数据进行了实证分析。结果表明感知行为控制、自我实现需要、沉浸需要、主观规范等四大因素对移动互联网用户持链接分享链接意愿和链接行为具有显著的正向影响。该结论有利于指导信息门户网站开展网络链接技术优化以及社会商业信息的推广活动。
DOI:10.12005/orms.2016.0061      URL     [本文引用:1]
(Gu Dongxiao, Sun Jianjun, Zhang Yue, et al.An Empirical Study on Internet Users’ Links Sharing Based on Planned Behavior Theory[J]. Operations Research and Management Science, 2016, 25(2): 173-179.)
[19] 李颖琦, 王宇露. 基于修正计划行为理论的大型企业虚拟学习社区知识共享研究——来自212个虚拟学习社区的实证[J]. 情报杂志, 2010, 29(5): 48-53.
传统的计划行为理论认为主观规范对知识共享行为存在直接作用。本文认为主观规范应在共享态度、感知行为控制和知识共享行为间起调节作用,并建立了虚拟学习社区中知识共享的影响因素模型。通过收集五家大型企业的212个样本进行实证,结果发现共享态度和感知行为控制对知识共享行为有着显著的正向影响;共享意向在共享态度、感知行为控制与知识共享行为间存在显著的中介作用;主观规范部分调节了共享态度与知识共享行为间的关系,完全调节了感知行为控制与知识共享行为间的关系。
DOI:10.3969/j.issn.1002-1965.2010.05.010      URL     [本文引用:1]
(Li Yingqi, Wang Yulu.A Research on Knowledge Sharing in Sizeable Enterprise’s Virtual Learning Community Based on Adjusted Theory of Planned Behavior[J]. Journal of Intelligence, 2010, 29(5): 48-53.)
[20] 王星辰. 社会化问答网站知识共享影响因素研究——基于计划行为理论[D]. 合肥: 中国科学技术大学, 2017.
[本文引用:1]
(Wang Xingchen.Research on the Factors Affecting Knowledge Sharing of Social Q&A Websites Based on the Theory of Planned Behavior[D]. Hefei: University of Science and Technology of China, 2017.)
[21] Saeri A K, Ogilvie C, La Macchia S T, et al. Predicting Facebook Users’ Online Privacy Protection: Risk, Trust, Norm Focus Theory, and the Theory of Planned Behavior[J]. The Journal of Social Psychology, 2014, 154(4): 352-369.
The present research adopts an extended theory of the planned behavior model that included descriptive norms, risk, and trust to investigate online privacy protection in Facebook users. Facebook users (N = 119) completed a questionnaire assessing their attitude, subjective injunctive norm, subjective descriptive norm, perceived behavioral control, implicit perceived risk, trust of other Facebook users, and intentions toward protecting their privacy online. Behavior was measured indirectly 2 weeks after the study. The data show partial support for the theory of planned behavior and strong support for the independence of subjective injunctive and descriptive norms. Risk also uniquely predicted intentions over and above the theory of planned behavior, but there were no unique effects of trust on intentions, nor of risk or trust on behavior. Implications are discussed.
DOI:10.1080/00224545.2014.914881      PMID:25154118      URL     [本文引用:1]
[22] 刘敏, 王莉. 社交网络中微博用户行为的分析与预测[J]. 太原理工大学学报, 2016, 47(6): 786-792.
从真实的新浪微博数据中分析用户的转发行为,提取了用户特征、微博特征、交互特征和结构特征等4个方面的影响转发行为的因素。通过实证分析各个特征对转发行为的具体影响,并利用机器学习中的不同预测算法对用户是否会对给定主题的微博产生转发行为进行预测。实验表明,用我们选取的因素,结合逻辑回归模型对于用户转发行为的预测更加准确。
DOI:10.16355/j.cnki.issn1007-9432tyut.2016.06.019      URL     [本文引用:1]
(Liu Min, Wang Li.Analysis and Prediction of Microblog User Behavior on Social Networks[J]. Journal of Taiyuan University of Technology, 2016, 47(6): 786-792.)
[23] Weng J, Lim E P, Jiang J, et al.TwitterRank: Finding Topic-sensitive Influential Twitters[C]// Proceedings of the 3rd ACM International Conference on Web Search and Data Ming. 2010: 261-270.
[本文引用:2]
[24] Wang C, Jin X L, Lee M K O, et al. Understanding Status Update in Microblog: A Perspective on Media Needs[C]// Proceedings of the 17th Pacific Asia Conference on Information Systems, 2013.
[本文引用:1]
[25] Huang J, Cheng X, Shen H, et al.Exploring Social Influence via Posterior Effect of Word-of-Mouth Recommendations[C]]// Proceedings of the 5th ACM International Conference on Web Search and Data Mining. 2012: 573-582.
[本文引用:1]
[26] 廖海涵, 靳嘉林, 王曰芬. 网络舆情事件中微博用户行为特征和关系分析——以新浪微博“雾霾调查: 穹顶之下”为例[J]. 情报资料工作, 2016(3): 12-17.
[本文引用:1]
(Liao Haihan, Jin Jialin, Wang Yuefen.Behavioral Characteristics and Relationship Analysis of Weibo Users in Internet Public Opinion Event: Taking “Smog Investigation: Under the Dome” of Sina Weibo as Example[J]. Information and Documentation Services, 2016(3): 12-17.)
[27] Endres D M, Schindelin J E.A New Metric for Probability Distributions[J]. IEEE Transactions on Informations Theory, 2003, 49(7): 1858-1860.
We introduce a metric for probability distributions, which is bounded, information-theoretically motivated, and has a natural Bayesian interpretation. The square root of the well-known /spl chi//sup 2/ distance is an asymptotic approximation to it. Moreover, it is a close relative of the capacitory discrimination and Jensen-Shannon divergence.
DOI:10.1109/TIT.2003.813506      URL     [本文引用:1]
[28] 刘玮, 贺敏, 王丽宏, . 基于用户行为特征的微博转发预测研究[J]. 计算机学报, 2016, 39(10): 1992-2005.
微博转发预测对微博话题检测和微博影响力评估具有重要意义,引起了学界和产业界的广泛关注.现有方法主要集中在微博属性及微博传播网络特征的研究,没有充分考虑转发行为的动态性和用户历史行为的规律性.文中从微博能见度和用户行为特征角度研究微博转发预测问题,(1)提出了基于用户活跃期和时间窗的转发行为、忽略行为、未接收行为识别方法,为模型训练和效果分析提供了更为准确的数据基础;(2)提出了基于时间衰减的用户兴趣计算模型,有效度量用户兴趣及其变化特性对用户转发行为的影响程度;(3)提出了用户转发率、交互频率等用户行为特征,有效度量了用户历史行为模式和用户影响力传递效应的差异性对用户转发行为的影响,最后融合上游用户特征、微博特征、转发用户兴趣和历史行为特征,提出了基于分类模型的转发行为预测方法.在真实数据上的实验结果表明,该方法能够有效提升预测准确性,并且能够在较小规模的训练集上取得好的预测效果.
DOI:10.11897/SP.J.1016.2016.01992      URL     [本文引用:1]
(Liu Wei, He Min, Wang Lihong, et al.Research on Microblog Retweeting Prediction Based on User Behavior Features[J]. Chinese Journal of Computers, 2016, 39(10): 1992-2005.)
[29] Kawk H, Lee C, Park H, et al.What is Twitter, a Social Network or a News Media?[C]// Proceedings of the 19th International Conference on World Wide Web. ACM, 2010: 591-600.
[本文引用:1]
资源
PDF下载数    
RichHTML 浏览数    
摘要点击数    

分享
导出

相关文章:
关键词(key words)
计划行为理论
LDA主题模型
用户行为分析

Theory of Planned Behavio...
LDA Topic Model
User Behavior Analysis

作者
席林娜
窦永香

Xi Linna
Dou Yongxiang