数据分析与知识发现  2018 , 2 (4): 99-109 https://doi.org/10.11925/infotech.2096-3467.2017.1256

研究论文

移动社交网络微信用户信息发布行为统计特征分析*

王飞飞, 张生太

北京邮电大学经济管理学院 北京 100876

Analyzing Information Behaviors of Mobile Social Network Users

Wang Feifei, Zhang Shengtai

School of Economics and Management, Beijing University of Posts and Telecommunications, Beijing100876, China

中图分类号:  G206

通讯作者:  通讯作者:张生太, ORCID: 0000-0003-3365-6930, E-mail: sttzz@163.com

收稿日期: 2017-12-12

修回日期:  2018-02-4

网络出版日期:  2018-04-25

版权声明:  2018 《数据分析与知识发现》编辑部 《数据分析与知识发现》编辑部

基金资助:  *本文系国家自然科学基金项目“移动社交网络微信的知识传播机理研究”(项目编号: 71571022)的研究成果之一

展开

摘要

目的】探究移动社交网络微信用户信息发布行为统计特征。【方法】以“微信”为研究对象, 通过爬取微信用户5年内的朋友圈信息, 从微信用户特征、微信信息内容、微信信息发布时间、微信点赞数与评论数对用户信息发布行为统计特征进行分析。【结果】用户信息发布内容受用户特征的影响; 不同内容下的信息点赞与评论数也会有显著差异; 同时, 微信用户的信息发布时间间隔分布显示大多数用户的发布行为会在较短时间内密集发生。【局限】受收集范围和技术的限制, 实验样本数量有待扩充,得出的结论有待进一步推广。【结论】研究用户信息发布行为统计特征, 为探究社交网络用户信息发布行为提供了理论支撑。

关键词: 移动社交网络 ; 微信用户 ; 信息发布 ; 统计特征

Abstract

[Objective] This paper aims to explore the information behaviors of mobile social network (WeChat) users. [Methods] We crawled the WeChat users’ published posts in the past 5 years, and analyzed their information behaviors based on their characteristics, information contents, WeChat message posted time, WeChat Like and comment numbers. [Results] User-generated contents were affected by the user’s characteristics. There were significant differences among the numbers of Like and comments on different contents. WeChat users’ information posting intervals showed that most WeChat behaviors occurred within a short period of time. [Limitations] The sample size needs to be expanded to generalize our conclusions. [Conclusions] This study provides theoretical foundations for analyzing the behaviors of mobile social network users.

Keywords: Mobile Social Network ; WeChat Users ; Information Release ; Statistical Characteristics

0

PDF (3946KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

王飞飞, 张生太. 移动社交网络微信用户信息发布行为统计特征分析*[J]. 数据分析与知识发现, 2018, 2(4): 99-109 https://doi.org/10.11925/infotech.2096-3467.2017.1256

Wang Feifei, Zhang Shengtai. Analyzing Information Behaviors of Mobile Social Network Users[J]. Data Analysis and Knowledge Discovery, 2018, 2(4): 99-109 https://doi.org/10.11925/infotech.2096-3467.2017.1256

1 引 言

随着移动互联网时代的到来, 人们获取信息的途径越来越丰富, 智能手机的应用在给人们带来便利的同时也产生了海量的信息。据中国互联网络信息中心(CNNIC)2017年发布第40次《中国互联网络发展状况统计报告》[1]显示, 截至2017年6月, 中国手机网民规模达到7.24亿, 其中微信朋友圈在社交应用中使用率达到85.8%。微信是一个集社交功能、分享功能和娱乐功能为一体的新媒体平台。人们通过微信这个媒介记录生活的点滴、与朋友互动、表达自己的观点、发表对热点事件的评论等。微信作为主流的在线社交网络工具, 用户在网络中的作用越发重要, 用户不仅是信息的传播者, 也成为信息的生产者。随着微信影响力的不断增强, 移动社交网络成为推动用户社会交往的主要力量, 研究微信用户的信息发布行为, 对于发现社交规律, 推动社交网络的发展具有重要意义。

传统的网络是以内容为中心进行组织的, 而移动社交网络是以用户为中心进行组织的。微信信息发布行为是以朋友圈为基础衍生出来的, 是社会元素与即时通信工具的融合。目前对微信的研究主要集中在微信的传播模式和社交特点。在微信的传播模式方面, 微信的大众传播能力弱, 朋友圈中的信息无法形成微博式的长链条的多级传播[2]; 微信社交特点方面, 微信中的社交关系具有私密性, 朋友圈中的照片评论以及回复只有相互认识的人才能看到[3], 以强人际关系为主, 其好友主要是亲戚、朋友、同事以及同学。现有对微信的研究主要针对微信平台本身的特点, 而缺乏对用户行为特征的研究。微信作为移动社交网络下的新兴媒体, 微信用户发布信息时间间隔分布是否具有明显的重尾特性?发布行为是否具有记忆性和阵发性?用户信息发布内容与信息的点赞与评论是否有差异?这些是本文试图解决的问题。由于微信的半封闭性及隐私性, 数据的不易获取性, 给微信用户的行为特征分析增加了难度。

2 研究现状

随着互联网技术和大数据技术的不断发展和提高, 学者们通过网络平台开放的API接口或者网络数据爬虫算法, 获取大规模的记录社交网络行为的数据, 这些数据为研究社交网络用户规律及其对信息发布行为的影响提供了基础。

国内外关于微信信息发布行为的研究主要有以下几个视角:

(1) 微信用户的使用动机及意愿。Gan研究了中国微信用户的点赞行为, 认为性别在激励用户点赞行为中起到调节的作用, 不同用户的点赞行为存在性别差异[4]。赵大丽等基于理性行为理论分析微信用户共享意愿的影响因素, 发现共享态度显著影响用户的共享意愿[5]; 李晨等从社交动机出发, 发现依赖性、普遍化趋势、便捷生活是影响微信用户信息分享行为的重要因素[6]

(2) 从传播学角度研究信息传播机制和特点。Weng认为, 在某段时间内, 一个用户的注意力总量独立于这段时间内的信息多样性, 即不受这段时间内话题数量的影响[7]; 唐晓波等认为, 主题的有趣程度会影响用户在社会化媒体上的行为, 与用户兴趣越相似, 被转发概率就越大, 而用户兴趣是由用户过去的行为推断得到的[8]。黄灿等认为获知消息及传播效率对用户关注订阅号的影响较为突出[9]

(3) 在社交网络用户发布行为方面的研究。人类的行为非常复杂, 每天会做很多重复的事情, 但这些事情的发生时间和持续时间并不是简单的重复, 人类的行为发生时间在统计上并不是均匀的泊松分布[10]。互联网下人类的各种活动的时间间隔不一定是相互独立的, 也不一定有相同的分布, 而是呈现胖尾的幂律分布。如网页浏览[11]、E-mail[12]、即时通信[13]、微博[14] 、维基百科[15]、GitHub[16]等, 国内外学者取得了一系列有价值的研究成果。2005年, Barabási通过对大学里3 188位用户的收发信件数据进行分析, 发现个体回复时间和间隔时间均服从幂律分布[17]。Yan等研究了“微博”的微群14 186位用户的博文数据, 通过分析解释了用户主页微博发布时间间隔分布服从幂指数为1.3的幂律分布[18]。Leskovec等采集MSN即时通信的数据, 包括2.4亿用户间发生的约300亿次的交谈数据, 研究结果表明在群体层面用户间的交谈时间间隔服从指数为1.5的幂律分布[19]。Radicchi通过对维基百科的用户登录时间间隔分布研究得出, 用户登录时间间隔服从指数为1.2的幂律分布[20]。Chen等通过5位志愿者在QQ大约1年时间内的信息记录数据, 研究QQ用户行为的时间间隔, 发现个体层面时间间隔服从指数在2.0-2.5之间的幂律分布[21]

现有文献大多从单一角度分析用户信息发布行为, 这种单一分析有助于用户行为的细化研究, 但有时会忽略其他因素及各因素之间的相互影响。而微信用户信息发布行为是用户、信息内容、评论、点赞等综合作用的结果, 因此, 在移动社交网络下, 基于微信朋友圈的真实数据, 多角度地分析用户在微信使用中反映的各种行为特征, 研究微信用户的信息发布行为, 对于发现社交规律, 推动社交网络的发展具有重要意义。

本文依据微信的发布特点, 经过多次实验后, 爬取微信用户朋友圈的数据, 进而从发布时间间隔的角度对微信用户的信息发布行为规律进行研究。

3 数据来源

本文数据来自微信朋友圈。由于微信具有封闭性、没有开放的API接口、无法在网页显示等特征, 利用微信朋友圈与QQ空间可以同步发布信息这一特点, 运用爬虫软件, 使用安卓模拟器爬取腾讯微信朋友圈的近2万条数据。安卓模拟器是一种在电脑上模拟安卓操作系统的软件, 可以取得安卓系统的最高权限, 进而得到缓存数据。爬取数据的过程如图1所示。

图1   爬取数据的过程

   

在安卓模拟器中安装微信, 选取9名志愿者在模拟器中登录微信。微信朋友圈是基于强关系网络建立起来的圈子, 在这个半封闭的圈子, 选取用户的通讯录好友在230以上, 且从用户职业、学历等特征方面都进行严格筛选, 且爬取后对用户进行标号, 不涉及用户的隐私。打开微信朋友圈, 滑动志愿者的朋友圈至最底部, 从系统中提取有效缓存, 获取数据15 966条, 采集数据样本集如图2所示。主要包括微信昵称、微信号、发布时间、发布内容、评论内容、评论数、评论用户ID、点赞数、点赞用户ID、发布内容链接。由于微信平台的隐私保护, 用户的基本信息无法从后台直接爬取, 基于微信朋友的强关系网络, 其通讯录好友基本上都是熟知的圈子内的好友的这一微信特性, 因此本文对用户基本信息的获取, 采取如下方式: 志愿者分别在数据集中寻找各自朋友圈所对应的信息数据; 然后通过对数据集的用户昵称和发布内容的对应参考, 分别对该用户的信息如性别、年龄、教育程度、职业等进行标记; 标记完成后对志愿者的数据进行整合。

图2   微信朋友圈数据集格式

   

另外, 对于爬取数据进行初步筛选, 每个用户开始使用微信的时间不同, 数据爬取的时间跨度也不同。同时, 每个用户在朋友圈发布信息的数量有所不同, 信息条数有所差异。如表1所示, 选取的每个用户的数据集时间跨度5年左右, 且信息条数都在400以上, 爬取数据样本为15 966条, 数据的时间跨度及信息条数差异足以反映真实的统计规律。

表1   朋友圈信息汇总

   

用户消息数时间跨度(月)
A41724
B46849
C1 06245
D48827
E42663
F2 80735
G47423
H1 19930
I1 64157

新窗口打开

4 微信用户行为统计特征分析

4.1 变量定义

由于微信朋友圈其本身内容比较隐私且不公开, 因此本研究限定为微信用户朋友圈是公开发布的, 如表2所示, 从用户个人特征(性别、年龄、受教育程度)、内容类型、时间间隔、评论数与点赞数来清晰阐述。

表2   定义变量

   

变量赋值含义
内容类型1非日志类
2日志类
评论数10
21-10
311-20
421以上
点赞数10
21-10
311-20
421以上
性别1
2
年龄120以下
221-30
331-40
441-50
551-60
661以上
受教育程度1研究生学历
2大学(本科和大专)
3高中或中专及以下
职业1全日制学生
2企业公司职员
3党政机关事业单位
4专业人士(会计、律师、建筑师、
医护人员、记者)
5教师
6其他

新窗口打开

为了研究不同性别、教育程度、职业等对微信用户发布信息的内容是否存在影响等, 本研究从用户个人统计信息如性别、年龄、职业、受教育程度等进行分析[22]; 发布信息内容的不同会引发不同的关注和转发[23]。同时, 微信用户生成的日志类信息即用户通过所见所闻随时发布的原创信息; 非日志类信息即用户通过对网页、公众号或者朋友圈里的内容进行转发、分享所产生的信息。另外, 点赞与评论是微信最直观的信息反馈方式。用户会通过进一步转发、分享或者通过点赞、评论等方式进行信息的反馈。

4.2 用户个人特征分析

本文爬取了15 966条数据, 剔除信息内容缺失等无效数据, 最终使用样本为12 964条。如表3所示, 在本研究样本中, 男性占比42.3%, 女性占比57.7%; 年轻化群体占到总数的78.3%。企业及公司员工占到69%, 低学历群体不足15%。样本特点与第40次《中国互联网络发展状况统计报告》一致[1], 群体年龄结构主要集中在20-29岁, 学历以中等学历为主, 职业以学生群体与企业职员为主。这表明本研究的样本数据特点符合目前的互联网用户发展统计情况, 本研究的样本具有代表性。

表3   用户个人特征基本情况

   

统计变量类型频次百分比(%)
性别5 12342.3
6 98257.7
年龄20以下1161.0
21-309 35377.3
31-401 56212.9
41-504783.9
51-603282.7
61以上2682.2
教育程度硕士及以上4 00933.1
大学(本科和大专)6 47953.5
高中或中专及以下1 61713.4
职业全日制学生5 86248.4
企业公司职员2 52520.9
党政机关事业单位2091.7
专业人士(会计、律师、
建筑师、医护人员、记者)
4463.7
教师1 59613.2
其他1 46612.1

新窗口打开

4.3 朋友圈信息发布情况分析

微信朋友圈信息发布情况包括信息内容、点赞、评论等。如表4所示, 微信用户的潜水者占到整个用户的一半以上, 潜水用户对圈子内用户发布信息持观望的态度, 不进行任何评论和点赞, 更不会进行信息的二次转发。评论数与点赞数的每个分段下的比例基本差异不大, 积极用户在进行评论时多数也会同时采取点赞行为。

表4   信息发布统计分析

   

统计变量类型频次百分比(%)
评论数010 26379.2
1-102 59520.0
11-20960.7
21以上100.1
点赞数05 68172.8
1-102 07926.6
11-20380.5
21以上70.1
信息发布内容非日志4 99738.7
日志7 93161.3

新窗口打开

4.4 时间统计特征分析

(1) 信息发布时间间隔分析

人类行为的时间统计特性不是均匀的, 其中伴随着长时间的静默和短时间内的高频率的爆发, 相继行为的时间间隔分布具有明显的胖尾特征, 人们的多种多样的活动, 如网页浏览、电子邮件通信、博客和微博发帖、短消息通信、看电影等都被进行了分析, 并且在时间间隔上展现出同样的胖尾分布而不是传统研究所认为的指数分布[24]。通过大量的在线社交网络数据集的实证研究发现, 社交网络用户具有相似的统计规律, 即行为时间间隔在大多数情况下具有异质性和阵发性, 可以用$P(\tau )\tilde{\ }{{\tau }^{-\alpha }}$($\tau $表示连续两次行为的时间间隔)来描述。因此本文基于移动社交网络微信朋友圈数据, 采用White等提出的MLE估算CDF的方法来拟合幂律值[25]。可以用幂律分布函数更好地拟合, 即:

$P(\tau )\tilde{\ }{{\tau }^{-\alpha }}$ (1)

在原分布满足公式(1)的情况下, 其累计分布满足公式(2)。

$P(X\gg x)$$=C\int_{x}^{\infty }{{{x}^{-\alpha }}dx}=\frac{C}{\alpha -1}{{x}^{-(\alpha -1)}}$ (2)

为了分析微信信息发布行为特性, 本文对9名用户的时间间隔分布进行研究。根据用户发布信息的时间数据, 利用分布图探索用户连续两次发布行为的时间间隔分布规律。图3给出9名微信用户信息发布行为.时间间隔的累积分布图(横轴表示时间间隔分布, 纵轴表示累积概率密度)。

图3   微信用户信息发布行为时间间隔分布

   

图3所示, 图形具有庞大的尾部, 有明显的“胖尾”特征, 拟合出来的9位用户朋友圈发布信息间隔的

幂指数都在1-2之间, 且与网页浏览、在线电影点评和社交网络中行为的时间间隔分布幂指数相近, 都在1-3之间[26,27], 说明用户发布朋友圈的行为具有幂律特征。表明大多数用户发布信息的时间间隔分布中, 有少量的时间间隔很长, 即少数信息时间间隔大, 而多数信息时间间隔小, 大多数发布行为会在较短时间内密集发生, 然后又会出现一个很长的空档期。

(2) 阵发性与记忆性

当时间间隔分布服从幂函数律时, 有时候很多事件会在较短时间内密集发生, 然后又会出现一个很长的空档期, 这种情况叫做阵发性(用B表示)。对于泊松分布, 均值和标准差相等, 因此B恰为0; 对于严重的胖尾分布, 标准差远大于均值, B靠近1; 对于周期性规则信号, 时间间隔分布实际上是一个δ 函数, 标准差为0, B值为-1。事件发生的时间序列还可以用记忆性来刻画。如果一个长的时间间隔后容易跟着一个也较长的时间间隔, 而短的时间间隔后容易跟着一个也较短的时间间隔, 即一个行为发生的时间序列被认为具有记忆性(用M表示)。M的取值范围在-1~1之间: M>0意味着记忆效应, M<0意味着反记忆效应。

表5所示, 9名用户的B值均靠近1, 仅有1名用户表现出弱记忆性, 其他8名用户则表现出弱的反记忆性, 短(长)时间间隔后通常会伴随着长(短)时间间隔。这与阵发性结果一致。表明微信用户在信息发布时, 大多数用户集中在一个较短的时间间隔内, 然后出现一个很长的空档。这也体现了微信作为即时通信的碎片化的特性, 用户在时间空余时, 利用碎片化的时间通过微信发布信息, 发布行为会在较短时间内密集发生, 然后又会出现一个很长的空档期。微信发布不同于其他社交网络, 以半封闭的强关系网络为基础, 用户在发布朋友圈信息时可以比较随性地在自己的圈子里发布信息。

表5   9位用户的记忆性与阵发性

   

用户BM
A0.9033-0.0081
B0.8953-0.0044
C0.9359-0.0127
D0.9097-0.0225
E0.9072-0.0057
F0.9608-0.0105
H0.90910.007
I0.9412-0.0103
J0.9469-0.0033

新窗口打开

(3) 不同间隔下的用户时间间隔分布

9位用户的幂指数在1~2之间, 但在分钟、小时和天的不同尺度上指数是不同的, 笔者依据数据的时间跨度的不同选取三名有代表性的用户: A、C、I, 他们的时间跨度分别为2年、3年和4年。

图4所示, 通过对三名用户的时间间隔调整, 在1h、2h、3h、4h、5h的间隔下(如1h代表信息发布时间间隔为1小时), 三名用户的分布还是服从幂指数分布。三名用户的幂指数随着时间间隔的增大都有增大趋势, 即微信本身的半封闭性特点及朋友圈内的强关系网络, 用户的朋友圈内好友多半以上都是与用户个人特征且兴趣爱好类似的好友, 同一个圈子内发布信息的时间间隔差异也会很小。

图4   时间间隔分布(1h-5h)

   

4.5 信息的点赞数与评论数差异分析

微信用户通过朋友圈生成不同种类的内容, 那么相对应得到的评论、点赞条数也会有所不同。如表6表7所示, 可以看出点赞数、评论数与信息发布内容的差异分析的卡方值分别为391.705(p<0.001)、 657.60(p<0.001), 似然比为422.652(p<0.001)、731.75(p<0.001), 说明用户在对朋友圈内容进行点赞与评论时侧重于日志类信息。

表6   内容与点赞数的差异分析

   

内容分类点赞分类卡方检验LR检验
01-1011-2021以上
非日志计数4 48051421391.705***422.652***
所占比例%89.710.300
日志计数6 0071 882366
所占比例%75.723.70.50.1

新窗口打开

表7   内容与评论数的差异分析

   

内容分类评论分类卡方检验LR检验
01-1011-2021以上
非日志计数4 52846630657.607***731.75***
所占比例%90.69.30.10
日志计数5 7062 1229310
所占比例%71.926.81.20.1

新窗口打开

4.6 用户特征与信息发布内容的回归分析

多元Logistic回归适应于多因素、多分类变量的分析, 可以判断某个变量相对于参照对象的发生概率, 模型参数的估计采取最大似然估计。表8是自变量似然比检验结果。参数估计结果如表9所示。可以看出, 各自变量的显著性水平都比较低, 表明拟合度较好。

表8   模型似然比检验

   

因子-2倍对数似然值卡方df显著水平
截距1112.095.0000.
性别1201.66389.5681.000
年龄1418.631306.5365.000
教育1173.42561.3302.000
职业1149.16637.0715.000

新窗口打开

表9   参数估计结果

   

类型变量日志显著性水平
常数项截距-1.504.000
性别性别=男 (对照组=性别女)-.385.000
年龄[年龄=1] (对照组=年龄6)2.338.000
[年龄=2] (对照组=年龄6)2.543.000
[年龄=3] (对照组=年龄6)2.280.000
[年龄=4] (对照组=年龄6)1.529.000
[年龄=5] (对照组=年龄6)1.183.000
教育[教育=1] (对照组=教育3)-.309.001
[教育=2] (对照组=教育3).050.552
职业[职业=1] (对照组=职业6)-.238.004
[职业=2] (对照组=职业6)-.046.584
[职业=3] (对照组=职业6)-.781.000
[职业=4] (对照组=职业6).015.901
[职业=5] (对照组=职业6)-.075.475

新窗口打开

在用户个人特征层面, 与非日志相比较, 用户的性别、年龄对于信息发布内容都会产生一定的影响。而教育程度为本科以上, 职业为学生、事业单位人员、教师的用户对信息发布内容影响并不显著。结果表明, 性别对微信信息发布具有较大的影响, 女性更容易发布日志类信息, 而男性则不倾向表露, 易选择转发行为。不同年龄段对信息发布内容都会有影响, 但年轻群体更易于发布日志信息。教育程度为本科的群体更倾向于通过发布日志类信息向朋友圈用户传达自己的见解和观点。职业为企业公司职员、相关的专业人士较其他职业的用户, 易通过发布自己的原创性的信息进行表露。

5 结论与展望

本文通过网络爬虫软件获取微信朋友圈用户的相关数据, 并从用户个人特征、信息发布内容、点赞数、评论数、信息发布时间间隔分析用户信息发布行为, 主要研究结论如下:

(1) 从用户个人特征角度, 不同特征的用户信息发布的内容存在显著差异。微信朋友结构与用户的学历、年龄、工作经历和人生阅历息息相关, 且在一定程度上体现了“物以类聚、人以群分”的道理。在前人的基础上, 本文从实证角度验证了用户个人特征对信息发布内容的差异, 研究发现, 女性群体更倾向于发布日志类信息; 教育程度为本科的群体更易进行原创日志类内容的生成; 企业公司职员较其他职业易通过日志类的信息来表露自己。不同特征用户针对信息发布行为的不同偏好, 如, 女性用户较男性将更有可能提供日常生活类等原创信息, 企业公司职员可能从自己的工作角度发布自己的日常写照等。因此, 社交媒体平台运营者可以针对用户的不同特征, 对不同群体的用户采取不同的策略以满足他们的需求。

(2) 用户在对朋友圈内容进行点赞与评论都侧重于日志类信息。基于Gan等[4]的研究, 本文验证了用户在对信息进行评论时, 多数也会同时进行点赞行为。另外本研究发现用户评论数与点赞数在每个分段下的比例差异不大。微信用户对信息的评论与点赞的差异研究对移动社交网络下的开发者和平台运营者具有重要的意义, 对于开发人员, 可以根据用户的评论与点赞数预测用户的需求, 提升社交服务功能。

(3) 移动社交网络下微信的发布时间间隔分布, 微信用户的信息发布行为符合人类行为动力学的时间特性, 即大多数用户的发布行为会在较短时间内密集发生, 微信用户信息发布间隔时间的分布符合幂律分布。周涛等通过对人类行为中时间和空间的特性分析提出, 尽管不同系统的人类行为的时间间隔分布不同, 但都有比泊松分布所预测的分布更胖的尾部[27]。本文通过对微信朋友圈内用户信息发布时间间隔的动力学研究, 发现微信用户的信息发布行为符合人类行为动力学的时间特性。表明大多数用户的大多数发布行为会在较短时间内密集发生; 发布行为表现出来弱的反记忆性, 发布行为在一个长的时间间隔后容易跟着一个较短的时间间隔, 而短的时间间隔后容易跟着一个也较长的时间间隔; 微信用户的发布行为与其他在线网络行为有一些差异, 微信朋友圈内的好友都是强关系网络, 其行为特征基本类似, 内部差异很小。

研究结果对移动社交网络用户信息发布行为分析及监管具有重要的理论和现实意义。研究微信用户信息发布行为时, 用户是信息共享一个重要的影响因素。社交网络用户信息行为的研究大多数是一些研究计算机的学者, 他们过多地关注信息的传播, 而对用户及信息的内容关注不够, 实际上用户特征及信息的内容对其传播有重要的影响。微信朋友圈中的信息可以作为内容来分类, 具有某种特征的人群可能对某些信息更感兴趣, 从人的特征与信息的特征匹配角度研究信息共享行为将更能够符合实际。用户个人特征与信息共享行为的关系是非常密切的, 如不同特征用户的共享信息的内容是否有差异, 共享的时间间隔是否符合人类行为的规律等, 对这些问题的研究是信息共享行为研究的前提, 且为进一步研究共享行为提供理论参考。

移动社交网络的环境发展过程并不长, 对于用户个人特征、用户行为等方面还没有完善的理论描述和模型定义, 都处于研究起步阶段。用户数量大, 信息更新快, 识别复杂, 并且采集广泛用户数据的复杂度高。因此, 对于移动社交网络用户共享行为分析将是一个新的挑战。在移动社交用户发布信息时, 网络服务平台可以通过对用户的行为特征的监测, 对用户转发评论行为进行监测和管理。同时移动社交网络用户信息发布行为动力学分析对微信后台通过用户发布间隔行为进一步控制信息发布内容的质量进而引导用户在发布信息时的理性思考, 减少不良信息的传播, 达到舆情监控的效果。此外, 通过研究用户特征对信息发布内容的影响可以发现不同用户信息对生成内容的差异, 有利于公众平台从用户角度进行个性化推荐。

本研究有一些局限。受收集范围和技术的限制, 仅收集15 966条数据, 未来将扩大样本采集, 丰富数据, 进一步深入分析, 以将本研究的结果推广到更多的群体并在时间上进行延伸。此外, 本研究主要集中于用户年龄、教育程度、职业等, 并没有考虑其他因素的影响, 如使用时长、收入水平等。进一步的研究可以考虑将其他个人统计变量结合起来, 以充分确定用户特征对生成内容行为的影响。同时可以考虑将时间间隔延伸到评论与点赞的规律研究, 更深入研究微信用户的信息发布规律。

作者贡献声明

王飞飞: 设计研究方案, 数据采集, 清洗数据, 论文撰写及修订;

张生太: 提出研究思路, 数据分析及论文最终版本修订。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: wff0102@126.com。

[1] 王飞飞, 张生太. wechatmoment.xls. 朋友圈数据特征集.

[2] 王飞飞, 张生太. wechatdata.txt. 用户时间间隔数据.


参考文献

[1]

第40次中国互联网络发展状况统计报告

[EB/OL]. [2017- 08-04]. .

URL      [本文引用: 2]     

(

The 40th China Statistical Report on Internet Development

[EB/OL]. [2017-08-04].

URL      [本文引用: 2]     

[2] 王欢, 祝阳.

人际沟通视阈下的微信传播解读

[J]. 现代情报, 2013, 33(7): 24-27.

https://doi.org/10.3969/j.issn.1008-0821.2013.07.005      URL      [本文引用: 1]      摘要

微信在人际沟通领域引发了一场革命,基于"媒介是人体器官延伸"的理论,分析微信功能,探讨微信进入社会流程后对社会成员的人际思考与对沟通方式的塑造作用。微信备受现代人的青睐,分别从满足体现自我价值、情感表达、娱乐消遣3个方面进行阐释。深入思考微信社交的本质变化:由原有的"弱关系"向基于手机通讯录的"强关系"转变,实现了基于熟人关系的全新互动。微信的半匿名性引发个体的去个性化与去抑制性,从道德滑坡、语言暴力化、交往快餐式化3个角度剖析其负面效用。

(Wang Huan, Zhu Yang.

WeChat Dissemination Analysis from Interpersonal Communication Perspective

[J]. Journal of Modern Information, 2013, 33(7): 24-27.)

https://doi.org/10.3969/j.issn.1008-0821.2013.07.005      URL      [本文引用: 1]      摘要

微信在人际沟通领域引发了一场革命,基于"媒介是人体器官延伸"的理论,分析微信功能,探讨微信进入社会流程后对社会成员的人际思考与对沟通方式的塑造作用。微信备受现代人的青睐,分别从满足体现自我价值、情感表达、娱乐消遣3个方面进行阐释。深入思考微信社交的本质变化:由原有的"弱关系"向基于手机通讯录的"强关系"转变,实现了基于熟人关系的全新互动。微信的半匿名性引发个体的去个性化与去抑制性,从道德滑坡、语言暴力化、交往快餐式化3个角度剖析其负面效用。
[3] 方兴东, 石现升, 张笑容, .

微信传播机制与治理问题研究

[J]. 现代传播(中国传媒大学学报), 2013, 35(6): 122-127.

[本文引用: 1]     

(Fang Xingdong, Shi Xiansheng, Zhang Xiaorong, et al.

Research on the Communication Mechanism and Governance of WeChat

[J]. Modern Media, 2013, 35(6): 122-127.)

[本文引用: 1]     

[4] Gan C.

Understanding WeChat Users’ Liking Behavior: An Empirical Study in China

[J]. Computers in Human Behavior, 2017, 68:30-39.

https://doi.org/10.1016/j.chb.2016.11.002      URL      [本文引用: 2]      摘要

Liking behavior in social media is growing in popularity. Yet there has been a lack of research and understanding of the factors that motivate users to click “like” in social media. In this study, based on the uses and gratifications theory, a research model is developed to examine what factors affecting users' liking behavior in WeChat. And gender is considered as the moderating factor in the model. Using 215 valid data from the WeChat users in China, the model is empirically assessed by PLS-SEM. Results show that three types of gratifications positively affect WeChat users' liking behavior: hedonic gratification (enjoyment), social gratification (social support) and utilitarian gratification (information seeking). In particular, enjoyment plays the most important role in determining the liking behavior, followed by social support and information seeking. In addition, gender acts as the moderator on the relationship between each gratification and liking behavior.
[5] 赵大丽, 孙道银, 张铁山.

社会资本对微信朋友圈用户知识共享意愿的影响研究

[J]. 情报理论与实践, 2016, 39(3): 102-107.

https://doi.org/10.16353/j.cnki.1000-7490.2016.03.020      URL      [本文引用: 1]      摘要

为探究微信朋友圈用户知识共享的影响因素,文章基于理性行为理论的核心思想构建社会资本、知识共享态度与知识共享意愿之间的关系模型,并运用PLS对问卷调查数据进行分析。研究结果表明,知识共享态度显著地影响知识共享意愿,结构资本、关系资本和认知资本都会对微信朋友圈用户知识共享态度产生影响作用,且关系资本的影响作用最大。

(Zhao Dali, Sun Daoyin, Zhang Tieshan.

Social Capital Impact on the Willingness of Knowledge Sharing of Users in WeChat Moments

[J]. Information Studies: Theory & Application , 2016, 39(3): 102-107.)

https://doi.org/10.16353/j.cnki.1000-7490.2016.03.020      URL      [本文引用: 1]      摘要

为探究微信朋友圈用户知识共享的影响因素,文章基于理性行为理论的核心思想构建社会资本、知识共享态度与知识共享意愿之间的关系模型,并运用PLS对问卷调查数据进行分析。研究结果表明,知识共享态度显著地影响知识共享意愿,结构资本、关系资本和认知资本都会对微信朋友圈用户知识共享态度产生影响作用,且关系资本的影响作用最大。
[6] 李晨, 黄灿.

微信用户信息分享行为动机研究

[J]. 现代情报, 2015, 35(5): 57-62.

https://doi.org/10.3969/j.issn.1008-0821.2015.05.011      URL      [本文引用: 1]      摘要

文章基于微信用户社交行为动机,通过群体访谈、自查匿名问卷调查等方式,利用SPSS和Visio进行信息分析模型构建和假设、绘图实证分析。结果表明,依赖性、普遍化趋势、便捷生活3个方面是影响微信用户信息分享行为的重要因素。最后,利用研究结果深化理论实践意义,引导微信持续健康发展。

(Li Chen, Huang Can.

Research on Motivation of WeChat Users’ Information Sharing Behaviors

[J]. Journal of Modern Information, 2015, 35(5):57-62.)

https://doi.org/10.3969/j.issn.1008-0821.2015.05.011      URL      [本文引用: 1]      摘要

文章基于微信用户社交行为动机,通过群体访谈、自查匿名问卷调查等方式,利用SPSS和Visio进行信息分析模型构建和假设、绘图实证分析。结果表明,依赖性、普遍化趋势、便捷生活3个方面是影响微信用户信息分享行为的重要因素。最后,利用研究结果深化理论实践意义,引导微信持续健康发展。
[7] Weng L.

Information Diffusion on Online Social Networks [D]

. Indiana University, 2014.

[本文引用: 1]     

[8] 唐晓波, 罗颖利.

融入情感差异和用户兴趣的微博转发预测

[J]. 图书情报工作, 2017, 61(9): 102-110.

https://doi.org/10.13266/j.issn.0252-3116.2017.09.013      URL      [本文引用: 1]      摘要

[目的J意义]微博转发是实现微博信息传播的重要方式,对用户转发行为进行研究可以更好地理解微博信息传播机制,对热点话题检测、舆情监控、微博营销等具有重要意义。针对以往研究中用户兴趣表示不够全面准确以及未考虑情感差异对用户转发行为的影响,提出一个融入情感差异和用户兴趣的微博转发预测模型。[方法/过程]该模型首先从维基百科中提取概念语义关系构建维基知识库,将其作为语义知识源对微博文本进行语义扩展,解决语义稀疏问题;对语义扩展后的用户历史微博进行聚类,提取用户兴趣主题和主题对用户的影响力;然后计算微博中各类情感的情感强度,提取情感差异特征;最后结合用户行为特征、用户交互特征、微博特征、用户兴趣特征和情感差异特征,运用SVM实现微博转发预测。[结果J结论]在新浪微博真实数据集上进行实验,验证了所提模型的有效性。

(Tang Xiaobo, Luo Yingli.

Integrating Emotional Divergence and User Interests into the Prediction of Microblog Retweeting

[J]. Library and Information Service, 2017, 61(9):102-110.)

https://doi.org/10.13266/j.issn.0252-3116.2017.09.013      URL      [本文引用: 1]      摘要

[目的J意义]微博转发是实现微博信息传播的重要方式,对用户转发行为进行研究可以更好地理解微博信息传播机制,对热点话题检测、舆情监控、微博营销等具有重要意义。针对以往研究中用户兴趣表示不够全面准确以及未考虑情感差异对用户转发行为的影响,提出一个融入情感差异和用户兴趣的微博转发预测模型。[方法/过程]该模型首先从维基百科中提取概念语义关系构建维基知识库,将其作为语义知识源对微博文本进行语义扩展,解决语义稀疏问题;对语义扩展后的用户历史微博进行聚类,提取用户兴趣主题和主题对用户的影响力;然后计算微博中各类情感的情感强度,提取情感差异特征;最后结合用户行为特征、用户交互特征、微博特征、用户兴趣特征和情感差异特征,运用SVM实现微博转发预测。[结果J结论]在新浪微博真实数据集上进行实验,验证了所提模型的有效性。
[9] 黄灿, 桂学文.

用户关注微信公众订阅号动机研究

[J]. 现代情报, 2015, 35(8): 28-34.

[本文引用: 1]     

(Huang Can, Gui Xuewen.

Research on Motivation of WeChat Subscriptions Attract Users’ Paying Attention

[J]. Journal of Modern Information, 2015, 35(8): 28-34.)

[本文引用: 1]     

[10] Fu F, Liu L, Wang L.

Empirical Analysis of Online Social Networks in the Age of Web 2.0

[J]. Physica A: Statistical Mechanics & Its Applications, 2008, 387(2-3): 675-684.

https://doi.org/10.1016/j.physa.2007.10.006      URL      [本文引用: 1]      摘要

Today the World Wide Web is undergoing a subtle but profound shift to Web 2.0, to become more of a social web. The use of collaborative technologies such as blogs and social networking site (SNS) leads to instant online community in which people communicate rapidly and conveniently with each other. Moreover, there are growing interest and concern regarding the topological structure of these new online social networks. In this paper, we present empirical analysis of statistical properties of two important Chinese online social networks blogging network and an SNS open to college students. They are both emerging in the age of Web 2.0. We demonstrate that both networks possess small-world and scale-free features already observed in real-world and artificial networks. In addition, we investigate the distribution of topological distance. Furthermore, we study the correlations between degree (in/out) and degree (in/out), clustering coefficient and degree, popularity (in terms of number of page views) and in-degree (for the blogging network), respectively. We find that the blogging network shows disassortative mixing pattern, whereas the SNS network is an assortative one. Our research may help us to elucidate the self-organizing structural characteristics of these online social networks embedded in technical forms.
[11] Gonçalves B, Ramasco J J.

Human Dynamics Revealed Through Web Analytics

[J]. Physical Review E: Statistical Nonlinear & Soft Matter Physics, 2008, 78(2):026123.

https://doi.org/10.1103/PhysRevE.78.026123      URL      PMID: 18850913      [本文引用: 1]      摘要

Abstract: When the World Wide Web was first conceived as a way to facilitate the sharing of scientific information at the CERN (European Center for Nuclear Research) few could have imagined the role it would come to play in the following decades. Since then, the increasing ubiquity of Internet access and the frequency with which people interact with it raise the possibility of using the Web to better observe, understand, and monitor several aspects of human social behavior. Web sites with large numbers of frequently returning users are ideal for this task. If these sites belong to companies or universities, their usage patterns can furnish information about the working habits of entire populations. In this work, we analyze the properly anonymized logs detailing the access history to Emory University's Web site. Emory is a medium size university located in Atlanta, Georgia. We find interesting structure in the activity patterns of the domain and study in a systematic way the main forces behind the dynamics of the traffic. In particular, we show that both linear preferential linking and priority based queuing are essential ingredients to understand the way users navigate the Web.
[12] Vazquez A, Rácz B, Lukács A, et al.

Impact of non- Poissonian Activity Patterns on Spreading Processes

[J]. Physical Review Letters, 2007, 98(15):158702.

https://doi.org/10.1103/PhysRevLett.98.158702      URL      PMID: 17501392      [本文引用: 1]      摘要

Halting a computer or biological virus outbreak requires a detailed understanding of the timing of the interactions between susceptible and infected individuals. While current spreading models assume that users interact uniformly in time, following a Poisson process, a series of recent measurements indicates that the intercontact time distribution is heavy tailed, corresponding to a temporally inhomogeneous bursty contact process. Here we show that the non-Poisson nature of the contact dynamics results in prevalence decay times significantly larger than predicted by the standard Poisson process based models. Our predictions are in agreement with the detailed time resolved prevalence data of computer viruses, which, according to virus bulletins, show a decay time close to a year, in contrast with the 1 day decay predicted by the standard Poisson process based models.
[13] Zhao Z D, Xia H, Shang M S, et al.

Empirical Analysis on the Human Dynamics of a Large-Scale Short Message Communication System

[J]. Chinese Physics Letters, 2011, 28(6):068901.

https://doi.org/10.1088/0256-307X/28/6/068901      URL      [本文引用: 1]      摘要

Research on human behavior has attracted increasing attention recently because of its scientific significance and potential applications. Some empirical results have indicated that the timing of many human activities follows non-Poisson statistics. We analyze a real-life huge dataset of short message communication with 6326713 users and 37577781 records during the 2006 Chinese New Year. The results show that the number of short message sendings, the interevent time between two consecutive short message sendings and the response time all follow heavy-tailed distribution. We further observe a strongly positive correlation between the activity and the power-law exponent of the interevent time distribution. In addition, the short message communication system displays a bursty property yet no memory effects, which is in particular different from some well-studied human-activited systems such as email-sending, library-loaning and file printing.
[14] Yan Q, Yi L, Wu L.

Human Dynamic Model Co-driven by Interest and Social Identity in the MicroBlog Community

[J]. Physica A: Statistical Mechanics and Its Applications, 2012, 391(4): 1540-1545.

https://doi.org/10.1016/j.physa.2011.08.038      URL      [本文引用: 1]      摘要

78 We study human behavior on MicroBlog and extend it to a mobile Internet context. 78 The intervals between information release and comment follow a power law. 78 We establish a human dynamic model co-driven by interest and social identity. 78 Messaging intervals are influenced by how much one user’s interest declines. 78 Social identity will slow down the decline of users’ interest.
[15] Wang P, Lei T, Chi H Y, et al.

Heterogenous Human Dynamics in Intra and Inter-day Time Scale

[J]. EPL (EuroPhysics Letters) , 2010, 94(94):18005.

https://doi.org/10.1209/0295-5075/94/18005      URL      [本文引用: 1]      摘要

In this paper, we study two large data sets containing the information of two different human behaviors: blog-posting and wiki-revising. In both cases, the interevent time distributions decay as power-laws at both individual and population level. As different from previous studies, we put emphasis on time scales and obtain heterogeneous decay exponents in intra- and inter-day range for the same dataset. Moreover, we observe opposite trend of exponents in relation to individual $Activity$. Further investigations show that the presence of intra-day activities mask the correlation between consecutive inter-day activities and lead to an underestimate of $Memory$, which explain the contradicting results in recent empirical studies. Removal of data in intra-day range reveals the high values of $Memory$ and lead us to convergent results between wiki-revising and blog-posting.
[16] Yan D C, Wei Z W, Han X P, et al.

Empirical Analysis on the Human Dynamics of Blogging Behavior on GitHub

[J]. Physica A: Statistical Mechanics & Its Applications, 2017, 465: 775-781.

https://doi.org/10.1016/j.physa.2016.08.054      URL      [本文引用: 1]      摘要

GitHub is a social collaborative coding platform on which software developers not only collaborate on codes but also share knowledge through blogs using GitHub Pages. In this article, we analyze the blogging behavior of software developers on GitHub Pages. The results show that both the commit number and the inter-event time of two consecutive blogging actions follow heavy-tailed distribution. We further observe a significant variety of activity among individual developers, and a strongly positive correlation between the activity and the power-law exponent of the inter-event time distribution. We also find a difference between the user behaviors of GitHub Pages and other online systems which is driven by the diversity of users and length of contents. In addition, our result shows an obvious difference between the majority of developers and elite developers in their burstiness property.
[17] Barabási A L.

The Origin of Bursts and Heavy Tails in Human Dynamics

[J]. Nature, 2005, 435(7039): 207-211.

https://doi.org/10.1038/nature03459      URL      PMID: 15889093      [本文引用: 1]      摘要

Abstract: Understanding human dynamics is of major scientific and practical importance and can be increasingly addressed in a quantitative fashion thanks to electronic records capturing various human activity patterns. The authors of Ref. [1] revisit the datasets studied in Ref. [2], making four technical observations. Some of the observations of Ref. [1] are based on the authors' unfamiliarity with the details of the data collection process and have little relevance to the findings of Ref. [2] and others are resolved in quantitative fashion by other authors [3].
[18] Yan Q, Wu L, Zheng L.

Social Network Based Microblog User Behavior Analysis

[J]. Physica A: Statistical Mechanics & Its Applications, 2013, 392(7): 1712-1723.

https://doi.org/10.1016/j.physa.2012.12.008      URL      [本文引用: 1]      摘要

78 A social network based human dynamics model was proposed. 78 The distributions of out-degree, in-degree and total number of microblogs present power-law characters. 78 With the increase of degree, the exponent decreases much slower. 78 Inducing drive and spontaneous drive lead to the behavior of posting microblogs. 78 The simulation results match well with statistical and analytical results.
[19] Leskovec J, Horvitz E.

Planetary-scale Views on a Large Instant-messaging Network

[C]//Proceedings of the 17th International Conference on World Wide Web. ACM, 2008: 915-924.

[本文引用: 1]     

[20] Radicchi F.

Human Activity in the Web

[J]. Physical Review E, 2009, 80(2): 026118.

https://doi.org/10.1103/PhysRevE.80.026118      URL      PMID: 19792211      [本文引用: 1]      摘要

The recent information technology revolution has enabled the analysis and processing of large-scale data sets describing human activities. The main source of data is represented by the web, where humans generally use to spend a relevant part of their day. Here, we study three large data sets containing the information about web activities of humans in different contexts. We study in details interevent and waiting-time statistics. In both cases, the number of subsequent operations which differs by tau units of time decays powerlike as tau increases. We use nonparametric statistical tests in order to estimate the significance level of reliability of global distributions to describe activity patterns of single users. Global interevent time probability distributions are not representative for the behavior of single users: the shape of single users' interevent distributions is strongly influenced by the total number of operations performed by the users and distributions of the total number of operations performed by users are heterogeneous. A universal behavior can be anyway found by suppressing the intrinsic dependence of the global probability distribution on the activity of the users. This suppression can be performed by simply dividing the interevent times with their average values. Differently, waiting-time probability distributions seem to be independent of the activity of users and global probability distributions are able to significantly represent the replying activity patterns of single users.
[21] Chen G, Han X, Wang B.

Multi-level Scaling Properties of Instant-message Communications

[J]. Physics Procedia, 2010, 3(5): 1897-1905.

https://doi.org/10.1016/j.phpro.2010.07.034      URL      [本文引用: 1]      摘要

To research the statistical properties of human’s communication behaviors is one of the highlight areas of Human Dynamics. In this paper, we analyze the instant message data of QICQ from volunteers, and discover that there are many forms of non-Poisson characters, such as inter-event distributions of sending and receiving messages, communications between two friends, log-in activities, the distribution of online time, quantities of messages, and so on. These distributions not only denote the pattern of human communication activities, but also relate to the statistical property of human behaviors in using software. We find out that most of these exponents distribute between 611 and 612, which indicates that the Instant Message (IM) communication behavior of human is different from Non-IM communication behaviors; there are many fat-tail characters related to IM communication behavior.
[22] 彭希羡, 朱庆华, 刘璇.

微博客用户特征分析及分类研究——以“新浪微博”为例

[J]. 情报科学, 2015, 33(1): 69-75.

URL      [本文引用: 1]      摘要

以新浪微博为例,通过网络爬虫软件抓取新浪用户的相关信息。使用计量学方法,对用户特征进行统计分析,并利用决策树分析、相关性分析和关联挖掘用户特征。结果表明:新浪微博的认证用户和非认证用户之间存在明显差异;微博客用户的特性、发布微文时间段、微文长度、关注者、粉丝量和微文数等具有统计特性,地域差异明显;微博客用户选择是否公布城市,是否允许所有人私信、评论等之间存在一定关联关系;另外,通过对用户的分类发现,其中三种类型的用户群体之和占用户总体的85%以上,具有显著特性,为微博客用户特性的深入研究提供参考依据。

(Peng Xixian, Zhu Qinghua, Liu Xuan.

Research on Behavior Characteristics and Classification of Micro-blog Users—— Taking “Sina Micro-blog” as an Example

[J]. Information Science, 2015, 33(1): 69-75.)

URL      [本文引用: 1]      摘要

以新浪微博为例,通过网络爬虫软件抓取新浪用户的相关信息。使用计量学方法,对用户特征进行统计分析,并利用决策树分析、相关性分析和关联挖掘用户特征。结果表明:新浪微博的认证用户和非认证用户之间存在明显差异;微博客用户的特性、发布微文时间段、微文长度、关注者、粉丝量和微文数等具有统计特性,地域差异明显;微博客用户选择是否公布城市,是否允许所有人私信、评论等之间存在一定关联关系;另外,通过对用户的分类发现,其中三种类型的用户群体之和占用户总体的85%以上,具有显著特性,为微博客用户特性的深入研究提供参考依据。
[23] 郭爱芳, 章丹, 李小芳, .

微信公众号持续关注度影响因素的实证分析: 基于信息特性视角

[J]. 情报杂志, 2017, 36(1): 127-131.

https://doi.org/10.3969/j.issn.1002-1965.2017.01.022      URL      [本文引用: 1]      摘要

[目的/意义]微信公众号已成为众多机构信息推送的重要媒体,而公众号信息能否得到有效传播取决于用户的持续关注度。从信息特性视角细化研究其对微信公众号关注度的影响,有助于明晰组织该提供哪些特性的信息来吸引并保持用户关注,为公众号运营者的信息规划和内容设计提供一些参考。[方法/过程]分析了各信息特性要素对微信公众号用户持续关注度的影响,并用312份微信用户样本数据进行了实证检验。[结果/结论]结果表明:信息主题契合性、准确性、创新性和有用性对用户持续关注度有显著正向影响;不同类型微信公众号信息特性对用户持续关注度的影响有差异。

(Guo Aifang, Zhang Dan, Li Xiaofang, et al.

An Empirical Study on Influencing Factors of Continuous Attention to WeChat Public Accounts: An Information Characteristics Perspective

[J]. Journal of Intelligence, 2017, 36(1): 127-131.)

https://doi.org/10.3969/j.issn.1002-1965.2017.01.022      URL      [本文引用: 1]      摘要

[目的/意义]微信公众号已成为众多机构信息推送的重要媒体,而公众号信息能否得到有效传播取决于用户的持续关注度。从信息特性视角细化研究其对微信公众号关注度的影响,有助于明晰组织该提供哪些特性的信息来吸引并保持用户关注,为公众号运营者的信息规划和内容设计提供一些参考。[方法/过程]分析了各信息特性要素对微信公众号用户持续关注度的影响,并用312份微信用户样本数据进行了实证检验。[结果/结论]结果表明:信息主题契合性、准确性、创新性和有用性对用户持续关注度有显著正向影响;不同类型微信公众号信息特性对用户持续关注度的影响有差异。
[24] 郭进利.

一个人类行为动力学模型及其精确解

[J]. 物理学报, 2010, 59(6): 3851-3855.

https://doi.org/10.7498/aps.59.3851      Magsci      [本文引用: 1]      摘要

对于Baraba′si提出的基于人类行为的排队模型,比较了Baraba′si的解与Va′zquez的解,指出这两个解存在差异.提出一个服务台具有服务时间的人类行为动力学模型.通过严格的解析,计算出事件的等待时间分布,得到事件在系统中的逗留时间分布(这个指标在Baraba′si模型中没有被获得).结果表明,按照优先权选择协议,这个模型的等待时间分布是指数<i>γ</i>=2的幂律分布,这与钱学森通信回复时间分布的指数21非常接近.

(Guo Jinli.

A Model of Human Behavior Dynamics and Exact Results

[J]. Acta Physica Sinica, 2010, 59(6): 3851-3855.)

https://doi.org/10.7498/aps.59.3851      Magsci      [本文引用: 1]      摘要

对于Baraba′si提出的基于人类行为的排队模型,比较了Baraba′si的解与Va′zquez的解,指出这两个解存在差异.提出一个服务台具有服务时间的人类行为动力学模型.通过严格的解析,计算出事件的等待时间分布,得到事件在系统中的逗留时间分布(这个指标在Baraba′si模型中没有被获得).结果表明,按照优先权选择协议,这个模型的等待时间分布是指数<i>γ</i>=2的幂律分布,这与钱学森通信回复时间分布的指数21非常接近.
[25] White E P, Enquist B J, Green J L.

On Estimating the Exponent of Power-Law Frequency Distributions

[J]. Ecology, 2008, 89(4): 905-912.

https://doi.org/10.1890/07-1288.1      URL      PMID: 18481513      [本文引用: 1]      摘要

Power-law frequency distributions characterize a wide array of natural phenomena. In ecology, biology, and many physical and social sciences, the exponents of these power laws are estimated to draw inference about the processes underlying the phenomenon, to test theoretical models, and to scale up from local observations to global patterns. Therefore, it is essential that these exponents be estimated accurately. Unfortunately, the binning-based methods traditionally used in ecology and other disciplines perform quite poorly. Here we discuss more sophisticated methods for fitting these exponents based on cumulative distribution functions and maximum likelihood estimation. We illustrate their superior performance at estimating known exponents and provide details on how and when ecologists should use them. Our results confirm that maximum likelihood estimation outperforms other methods in both accuracy and precision. Because of the use of biased statistical methods for estimating the exponent, the conclusions of several recently published papers should be revisited.
[26] 赵庚升, 张宁, 周涛.

网页浏览中的标度行为研究

[J]. 统计与决策, 2009(1): 18-19.

URL      [本文引用: 1]      摘要

文章给出了用户上网的时间间隔分布以及用户群体访问单个网站的时间间隔分布。统计结果显示, 人们访问Internet的时间间隔分布具有幂律标度,但与最近报道的标度指数为1的普适类不一样的是,不同个体对应的标度指数明显不同。事实上,我们发 现,不管是群体用户访问单个站点,还是单个用户浏览网页,其时间间隔分布都符合幂指数介于2到3之间的幂律分布。本研究的统计结果对目前盛行的普适类说提 出了疑问,网页浏览的时间间隔分布是否存在普适类.如果存在普适类,那么幂指数到底是多少?搞清楚这几点对于深入认识人类动力学的潜在机制有借鉴意义。

(Zhao Gengsheng, Zhang Ning, Zhou Tao.

Scaling Behavior of Web Browsing

[J]. Statistics and Decision, 2009(1): 18-19.)

URL      [本文引用: 1]      摘要

文章给出了用户上网的时间间隔分布以及用户群体访问单个网站的时间间隔分布。统计结果显示, 人们访问Internet的时间间隔分布具有幂律标度,但与最近报道的标度指数为1的普适类不一样的是,不同个体对应的标度指数明显不同。事实上,我们发 现,不管是群体用户访问单个站点,还是单个用户浏览网页,其时间间隔分布都符合幂指数介于2到3之间的幂律分布。本研究的统计结果对目前盛行的普适类说提 出了疑问,网页浏览的时间间隔分布是否存在普适类.如果存在普适类,那么幂指数到底是多少?搞清楚这几点对于深入认识人类动力学的潜在机制有借鉴意义。
[27] 周涛, 韩筱璞, 闫小勇, .

人类行为时空特性的统计力学

[J]. 电子科技大学学报, 2013, 42(4):481-540.

https://doi.org/10.3969/j.issn.1001-0548.2013.04.001      URL      [本文引用: 2]      摘要

人类行为的定量化分析,特别是时空统计规律的挖掘和建模,是当前统计物理与复杂性科学研究的热点。对人类行为的深入理解,有助于解释若干复杂的社会经济现象,并在舆情监控、疾病防治、交通规划、呼叫服务、信息推荐等方面产生应用价值。该文综述人类行为时间和空间特性方面的研究进展,内容包括人类行为时间特性的实证分析和建模,人类行为空间特性的实证分析和建模,以及人类行为统计分析的应用研究。该文还将评述当前研究存在的亮点和不足,指出若干亟待解决的重大理论和实际问题。

(Zhou Tao, Han Xiaopu, Yan Xiaoyong, et al.

Statistical Mechanics on Temporal and Spatial Activities of Human

[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540.)

https://doi.org/10.3969/j.issn.1001-0548.2013.04.001      URL      [本文引用: 2]      摘要

人类行为的定量化分析,特别是时空统计规律的挖掘和建模,是当前统计物理与复杂性科学研究的热点。对人类行为的深入理解,有助于解释若干复杂的社会经济现象,并在舆情监控、疾病防治、交通规划、呼叫服务、信息推荐等方面产生应用价值。该文综述人类行为时间和空间特性方面的研究进展,内容包括人类行为时间特性的实证分析和建模,人类行为空间特性的实证分析和建模,以及人类行为统计分析的应用研究。该文还将评述当前研究存在的亮点和不足,指出若干亟待解决的重大理论和实际问题。

/