Please wait a minute...
Advanced Search
数据分析与知识发现  2018, Vol. 2 Issue (6): 70-78     https://doi.org/10.11925/infotech.2096-3467.2017.1311
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
社交博客标签增长态势与连接模式分析*
叶光辉1(), 胡婧岚1, 徐健2, 夏立新1
1华中师范大学信息管理学院 武汉 430079
2武汉大学信息资源研究中心 武汉 430072
Analyzing Growth Trends and Attachment Mode of Social Blog Tags
Ye Guanghui1(), Hu Jinglan1, Xu Jian2, Xia Lixin1
1School of Information Management, Central China Normal University, Wuhan 430079, China
2Center for the Studies of Information Resources, Wuhan University, Wuhan 430072, China
全文: PDF (680 KB)   HTML ( 1
输出: BibTeX | EndNote (RIS)      
摘要 

目的】揭示标签网络中节点链路的形成机理, 对社交博客标签的增长态势和连接模式进行分析。【方法】借助统计分析和网络分析指出标签增长模式; 在标签度分布分析的基础上, 细化统计标签连接的类型及对应的数量, 总结新加入标签的连接规律; 定义度度相关性指标, 验证标签连接服从优先连接模式的概率。【结果】发现标签最符合线性增长模式, 标签度分布呈现出单峰居中, 左侧震荡, 右侧平缓的态势, 不符合幂律分布。【局限】未能结合用户标记行为说明其对标签网络连接模式形成的影响。【结论】无论是“新标签-旧标签”还是“旧标签-旧标签”均不完全服从优先连接模式。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
叶光辉
胡婧岚
徐健
夏立新
关键词 社交博客标签增长态势连接模式社会网络优先连接度度相关    
Abstract

[Objective] This study reveals the forming mechanism of network nodes, aiming to examine the growth trend and attachment mode of social blog tags. [Methods] Firstly, we proposed the model of tag growth with the help of statistics and network analysis. Then, we established the categories of tag links and corresponding numbers, as well as summarized the connection rules of newly added tags. Finally, we defined the indicators of degree dependency and examined the probability of tag connection following preferential attachment modes. [Results] The tag growth showed the linear growth pattern and the distribution of tags had one single peak center, the shock left side and the gentle right side, which did not meet the power-law distribution. [Limitations] We did not explain the impacts of users’ tagging behaviors on the network connections. [Conclusions] Neither the “new tag-old tag” nor the “old tag-old tag” models are not fully compliant with the preferential attachment mode.

Key wordsSocial Blog Tag    Growth Trend    Attachment Mode    Social Network    Preferential Attachment    Degree Dependency
收稿日期: 2017-12-22      出版日期: 2018-07-11
ZTFLH:  G350  
基金资助:*本文系国家自然科学基金项目“基于‘排名分析-特征识别’的应急决策专家发现”(项目编号: 71740012)、国家社会科学基金重大项目“基于多维度聚合的网络资源知识发现研究”(项目编号: 13&ZD183)和湖北省自然科学基金项目“基于社会化标签挖掘的智慧城市‘印象云’构建模式研究”(项目编号: 2018CFB387)的研究成果之一
引用本文:   
叶光辉, 胡婧岚, 徐健, 夏立新. 社交博客标签增长态势与连接模式分析*[J]. 数据分析与知识发现, 2018, 2(6): 70-78.
Ye Guanghui,Hu Jinglan,Xu Jian,Xia Lixin. Analyzing Growth Trends and Attachment Mode of Social Blog Tags. Data Analysis and Knowledge Discovery, 2018, 2(6): 70-78.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.1311      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2018/V2/I6/70
时刻 年份 非重复标签数量(个)
0 2006 2 057
1 2007 2 686
2 2008 4 069
3 2009 5 488
4 2010 6 967
5 2011 7 779
6 2012 8 397
7 2013 8 838
8 2014 9 145
9 2015 9 465
10 2016 9 737
  2006年至今MetaFilter非重复标签数量统计结果
配对样本 样本数 相关
系数
相关
显著度p1
t t检验
显著度p2
对1-2013&2014 988 0.926 0.000 -19.410 0.000
对2-2014&2015 988 0.961 0.000 -16.516 0.000
对3-2015&2016 988 0.976 0.000 -13.982 0.000
  2013年-2016年样本配对检验结果
标签增长(Ⅰ) 标签增长(Ⅱ) 标签增长(Ⅲ) 标签增长(Ⅰ-Ⅲ)
不变 33.7% 33.2% 42.7% 24.5%
变大 66.3% 66.8% 57.3% 75.5%
  标签中心度变化情况统计
2013 2014 2015 2016
2013 Pearson 相关性 1 0.926** 0.843** 0.777**
显著性(双侧) 0.000 0.000 0.000
2014 Pearson 相关性 0.926** 1 0.961** 0.913**
显著性(双侧) 0.000 0.000 0.000
2015 Pearson 相关性 0.843** 0.961** 1 0.976**
显著性(双侧) 0.000 0.000 0.000
2016 Pearson 相关性 0.777** 0.913** .976** 1
显著性(双侧) 0.000 0.000 .000
  各年度标签度相关性分析
年度 标签增长阶段 Pearson相关性 显著性(双侧)
2013 (Ⅰ) -0.094** 0.003
2014 (Ⅱ) -0.100** 0.002
2015 (Ⅲ) -0.049 0.124
2016 (Ⅰ-Ⅲ) -0.146** 0.000
  标签度与标签增长相关性分析
  2013年标签度分布曲线
  2013年-2016年新标签plywood与其他新标签形成的标签网络
  2013年-2016年新标签plywood与旧标签形成的标签网络
  2013年-2016年旧标签vampiredeer与其他旧标签形成的标签网络
标签关系
时间
新标签-新标签 新标签-旧标签 旧标签-旧标签
2013-2014 4 611 17 616 31 060
2013-2015 3 372 18 140 59 821
2013-2016 4 038 21 213 88 045
  标签连接关系类型及特征统计
标签连接概率
时间
新标签-新
标签
新标签-旧标签 旧标签-旧标签
建立 强化
2013-2014 0.029 0.971 0.153 0.847
2013-2015 0.026 0.974 0.481 0.519
2013-2016 0.050 0.950 0.321 0.679
均值 0.035 0.965 0.318 0.682
  标签连接概率分析

标签连接模式
时间
新标签-旧标签 旧标签-旧标签
优先连接 非优先
连接
优先连接 非优先
连接
2013-2014 7 439 10 120 14 294 38 993
2013-2015 5 730 12 354 21 758 59 575
2013-2016 6 233 14 856 25 582 87 714
均值 6 467 12 443 20 545 62 094
  标签连接模式分析
[1] 张恒婷. 社交网络图像垃圾标签去除研究[D]. 北京: 华北电力大学, 2012.
[1] (Zhang Hengting.Research on Filtering Tag Spam of Social Network Images[D]. Beijing: North China Electric Power University, 2012.)
[2] 王贤兵. 社会标注可信度评价方法研究[D]. 武汉: 华中科技大学, 2012.
[2] (Wang Xianbing.Research on Method of Evaluating Confidence of Social Annotations[D]. Wuhan: Huazhong University of Science and Technology, 2012.)
[3] 刘苏祺, 白光伟, 沈航. 基于用户自描述标签的层次分类体系构建方法[J]. 计算机科学, 2016, 43(7): 224-229, 239.
[3] (Liu Suqi, Bai Guangwei, Shen Hang.Taxonomy Construction Based on User Self-describing Tags[J]. Computer Science, 2016, 43(7): 224-229, 239.)
[4] 李纲, 刘广兴, 毛进, 等. 一种基于句法分析的情感标签抽取方法[J]. 图书情报工作, 2014, 58(14): 12-20.
doi: 10.13266/j.issn.0252-3116.2014.14.002
[4] (Li Gang, Liu Guangxing, Mao Jin, et al.A Sentiment Label Extraction Method Based on Dependency Parsing[J]. Library and Information Service, 2014, 58(14): 12-20.)
doi: 10.13266/j.issn.0252-3116.2014.14.002
[5] 宋灵超, 黄崑. 基于社会标签的图像情感分类标注研究[J].图书情报工作, 2016, 60(21): 103-112.
doi: 10.13266/j.issn.0252-3116.2016.21.014
[5] (Song Lingchao, Huang Kun.Research on Image Emotional Annotations Based on Social Tags[J]. Library and Information Service, 2016, 60(21): 103-112.)
doi: 10.13266/j.issn.0252-3116.2016.21.014
[6] 于海鹏, 翟红生. 一种子空间聚类算法在多标签文本分类中应用[J]. 计算机应用与软件, 2014, 31(8): 288-291, 303.
doi: 10.3969/j.issn.1000-386x.2014.08.072
[6] (Yu Haipeng, Zhai Hongsheng.Applying a Subspace Clustering Algorithm in Multi-Label Text Classification[J]. Computer Applications and Software, 2014, 31(8): 288-291, 303.)
doi: 10.3969/j.issn.1000-386x.2014.08.072
[7] 杨尊琦, 赵瑾珺. 新浪微博用户领域分类标签的结构和互动研究[J]. 情报杂志, 2014, 33(4): 122-127.
doi: 10.3969/j.issn.1002-1965.2014.04.022
[7] (Yang Zunqi, Zhao Jinjun.Structure and Interaction: The User Category Tags on the Sina Microblog[J]. Journal of Intelligence, 2014, 33(4): 122-127.)
doi: 10.3969/j.issn.1002-1965.2014.04.022
[8] 叶光辉, 李纲. 社会语义网络结构分析——以MetaFilter为例[J]. 情报理论与实践, 2015, 38(12): 57-63.
doi: 10.16353/j.cnki.1000-7490.2015.12.012
[8] (Ye Guanghui, Li Gang.Structure Analysis on Semantic Social Network Based on MetaFilter[J]. Information Studies: Theory & Application, 2015, 38(12): 57-63.)
doi: 10.16353/j.cnki.1000-7490.2015.12.012
[9] Chen J, Feng S, Liu J.Topic Sense Induction from Social Tags Based on Non-negative Matrix Factorization[J]. Information Sciences, 2014, 280: 16-25.
doi: 10.1016/j.ins.2014.04.048
[10] Pan W, Chen S, Feng Z.Automatic Clustering of Social Tag Using Community Detection[J]. Applied Mathematics & Information Sciences, 2013, 7(2): 675-681.
doi: 10.12785/amis/070235
[11] Chelmis C, Prasanna V K.Social Link Prediction in Online Social Tagging Systems[J]. ACM Transactions on Information Systems, 2013, 31(4): 1-27.
doi: 10.1145/2516891
[12] Naseri S, Bahrehmand A, Ding C, et al.Enhancing Tag-based Collaborative Filtering via Integrated Social Networking Information[C]//Proceedings of IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. IEEE, 2013: 760-764.
[13] 易明, 毛进, 邓卫华. 基于社会化标签网络的细粒度用户兴趣建模[J]. 现代图书情报技术, 2011(4): 35-41.
[13] (Yi Ming, Mao Jin, Deng Weihua.Fine-grained User Preference Modeling Based on Tag Networks[J]. New Technology of Library and Information Service, 2011(4): 35-41.)
[14] Tu H, Wang X.Mining Users’ Interest Graph in Social Networks with Topic Based Tag Propagation[C]//Proceedings of IET International Conference on Smart and Sustainable City. IET, 2014: 282-285.
[15] 易明, 王学东, 邓卫华. 基于社会网络分析的社会化标签网络分析与个性化信息服务研究[J]. 中国图书馆学报, 2010, 36(2): 107-114.
[15] (Yi Ming, Wang Xuedong, Deng Weihua.Social Labeling Network Analysis and Personalized Information Service Research Based on Social Network Analysis[J]. Journal of Library Science in China, 2010, 36(2): 107-114.)
[16] 易明, 毛进, 邓卫华, 等. 社会化标签系统中基于社会网络的知识推送网络演化研究[J]. 中国图书馆学报, 2014, 40(2): 50-66.
[16] (Yi Ming, Mao Jin, Deng Weihua, et al.Evolution of Knowledge Push Network Based on Social Network in Social Tagging System[J]. Journal of Library Science in China, 2014, 40(2): 50-66.)
[17] Ma H, Jia M, Zhang D, et al. Combining Tag Correlation and User Social Relation for Microblog Recommendation[J]. Information Sciences, 2017, 385-386(C): 325-337.
doi: 10.1016/j.ins.2016.12.047
[18] 蔡国永, 林航, 文益民. 社会语义网社区发现标签传递算法研究[J]. 计算机科学, 2013, 40(2): 53-57.
[18] (Cai Guoyong, Lin Hang, Wen Yimin.Study on Label Propagation Based Community Detection Algorithm for Social Semantic Network[J]. Computer Science, 2013, 40(2): 53-57.)
[19] 李栋. 在线社会网络中信息扩散研究[D]. 哈尔滨: 哈尔滨工业大学, 2014.
[19] (Li Dong.Research of Information Diffusion in Online Social Networks[D]. Harbin: Harbin Institute of Technology, 2014.)
[20] 宋莉. 舆情热点事件中“标签式传播”现象研究——以“二代”现象为例[D]. 哈尔滨: 黑龙江大学, 2016.
[20] (Song Li.Study on Label Communication Phenomenon in the Hot Events of Public Opinion——Take “Sencond Genenration Phenomenon” as an Example[D]. Harbin: Heilongjiang University, 2016.)
[21] 查先进, 吕彬. 知识共享视角下的大众标注行为研究——基于标签的实证分析[J]. 图书馆论坛, 2010, 30(6): 76-81.
[21] (Zha Xianjin, Lv Bin.Study on the Behaviour of Social Tagging from the Aspect of Knowledge Sharing: An Empirical Analysis Based on Tags[J]. Library Tribune, 2010, 30(6): 76-81.)
[22] 郑惠中, 左万利. 基于信息增益与语义特征的多标签社交网络用户人格预测[J]. 吉林大学学报: 理学版, 2016, 54(3): 561-568.
doi: 10.13413/j.cnki.jdxblxb.2016.03.28
[22] (Zheng Huizhong, Zuo Wanli.Multi-labeled Social Networks Users Personality Prediction Based on Information Gain and Semantic Features[J]. Journal of Jilin University: Science Edition, 2016, 54(3): 561-568.)
doi: 10.13413/j.cnki.jdxblxb.2016.03.28
[23] 叶光辉, 夏立新, 李纲, 等. 社交博客标签分布的布拉德福定律验证分析[J]. 情报学报, 2018, 37(1): 76-85.
[23] (Ye Guanghui, Xia Lixin, Li Gang, et al.Bradford’s Law Confirmatory Analysis of Social Blog Tag Distribution[J]. Journal of the China Society for Scientific and Technical Information, 2018, 37(1): 76-85.)
[24] 邱均平. 信息计量学[M]. 武汉: 武汉大学出版社, 2007: 43-222.
[24] (Qiu Junping.Informetrics[M]. Wuhan: Wuhan University Press, 2007: 43-222.)
[25] Yule G U.A Mathematical Theory of Evolution, Based on the Conclusions of Dr. J. C. Willis, F. R. S[J]. Philosophical Transactions of the Royal Society of London(Series B), 1925, 213: 21-87.
doi: 10.1098/rstb.1925.0002
[26] 苏芳荔, 李江. 链接分布机制评述——优先连接和均匀连接[J]. 情报杂志, 2010, 29(10): 167-171.
doi: 10.3969/j.issn.1002-1965.2010.10.038
[26] (Su Fangli, Li Jiang.Review on the Mechanism of Link Degree Distribution——Preferential Attachment and Uniform Attachment[J]. Journal of Intelligence, 2010, 29(10): 167-171.)
doi: 10.3969/j.issn.1002-1965.2010.10.038
[1] 关鹏,王曰芬. 国内外专利网络研究进展*[J]. 数据分析与知识发现, 2020, 4(1): 26-39.
[2] 王欣瑞,何跃. 社交媒体用户交互行为与股票市场的关联分析研究: 基于新浪财经博客的实证[J]. 数据分析与知识发现, 2019, 3(11): 108-119.
[3] 陈芬, 付希, 何源, 薛春香. 融合社会网络分析与影响力扩散模型的微博意见领袖发现研究*[J]. 数据分析与知识发现, 2018, 2(12): 60-67.
[4] 王忠义, 张鹤铭, 黄京, 李春雅. 基于社会网络分析的网络问答社区知识传播研究[J]. 数据分析与知识发现, 2018, 2(11): 80-94.
[5] 李真, 丁晟春, 王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[6] 李飞, 张健, 王宗水. 社会化推荐研究进展与发展趋势演化*——基于文献计量和社会网络分析的视角[J]. 数据分析与知识发现, 2017, 1(6): 22-35.
[7] 王晰巍, 张柳, 李师萌, 王楠阿雪. 新媒体环境下社会公益网络舆情传播研究* ——以新浪微博“画出生命线”话题为例[J]. 数据分析与知识发现, 2017, 1(6): 93-101.
[8] 范如霞, 曾建勋, 高亚瑞玺. 基于合作网络的学者动态学术影响力模式识别研究[J]. 数据分析与知识发现, 2017, 1(4): 30-37.
[9] 王曰芬,靳嘉林. 比较分析《现代图书情报技术》近10年发文特征与发展趋势*[J]. 现代图书情报技术, 2016, 32(9): 1-16.
[10] 张磊,马静,李丹丹,沈洋. 语义社会网络的超网络模型构建及关键节点自动化识别方法研究*[J]. 现代图书情报技术, 2016, 32(3): 8-17.
[11] 吴应良, 姚怀栋, 李成安. 一种引入间接信任关系的改进协同过滤推荐算法[J]. 现代图书情报技术, 2015, 31(9): 38-45.
[12] 任妮, 周建农. 合著网络加权模式下科研团队的发现与评价研究[J]. 现代图书情报技术, 2015, 31(9): 68-75.
[13] 谭旻, 许鑫. 学术博客推荐网络的h度实证——以科学网博客为例[J]. 现代图书情报技术, 2015, 31(7-8): 31-36.
[14] 吴江, 张劲帆. 社会网络三元结构中关注影响力研究——以学生关系网络为例[J]. 现代图书情报技术, 2015, 31(10): 72-80.
[15] 李纲, 叶光辉. 多源专家特征信息融合研究[J]. 现代图书情报技术, 2014, 30(4): 27-33.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn