Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (3): 58-64     https://doi.org/10.11925/infotech.1003-3513.2013.03.10
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于LDA模型的社交网站自动量化评价研究
王嘉琦, 徐朝军, 李艺
南京师范大学教育科学学院 南京 210097
Quantified Evaluation for Social Networks Based on LDA Model
Wang Jiaqi, Xu Chaojun, Li Yi
School of Educational Science, Nanjing Normal University, Nanjing 210097, China
全文: PDF (749 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 在海量数据背景下,针对社交网站中队成员关系、话题热度及内涵的价值倾向等评价问题,提出一个基于LDA的两阶段社交网站自动量化评价模型。首先通过LDA方法将文本内容映射到主题空间,依据文本所属主题和用户特征来剔除垃圾信息;对于筛选出的信息,从用户、话题和社区三个角度提出一个新的社交网站的量化分析方法。最后,通过对西祠胡同的实验分析验证该模型的有效性和可行性。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王嘉琦
徐朝军
李艺
关键词 社交网络LDA主题模型两阶段评价    
Abstract:As propelled by the rapid growth of text data, it is urgent to utilize automated tools to monitor the user relationship, topic trend and the implying values of the platforms. A new modeling framework based on LDA is proposed to evaluate the social networks automatically. The authors first map the text into topic space, eliminating the uncorrelated information based on topic distribution and user feature, then create an evaluation method from social network analysis perspective, mining the structure of the social network from three aspects including user centrality, topic popularity and community activity. Experiments show that promising results are achieved by the new model.
Key wordsSocial network    LDA    Topic model    Two-stage evaluation
收稿日期: 2013-02-20      出版日期: 2013-05-14
:  TP391  
基金资助:本文系全国教育科学“十一五”规划2009年度教育部青年专项课题“网络课程使用现状自动量化评价系统研究”(项目编号:ECA090441)的研究成果之一。
引用本文:   
王嘉琦, 徐朝军, 李艺. 基于LDA模型的社交网站自动量化评价研究[J]. 现代图书情报技术, 2013, 29(3): 58-64.
Wang Jiaqi, Xu Chaojun, Li Yi. Quantified Evaluation for Social Networks Based on LDA Model. New Technology of Library and Information Service, 2013, 29(3): 58-64.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.03.10      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2013/V29/I3/58
[1] Kent State University.Website Evaluation Form[EB/OL].[2012-12-20]. http://www.library.kent.edu/internet/evalform.html.
[2] University of Michigan Law School. The Argus Clearinghouse[EB/OL].[2012-12-20]. http://www.clearinghouse.net.
[3] Jupiter Research Corporation[EB/OL].[2012-12-10]. http://www.jupiterresearch.com.
[4] 李长玲,王效岳,付鑫金.网站定量评价指标体系的构建与权值分配[J]. 图书情报工作 ,2008,52(7): 52-56.(Li Changling, Wang Xiaoyue, Fu xinjin. Construction of Quantitative Evaluation Index System and Weight Assignment for Websites[J].Library and Information Service, 2008,52(7):52-56.)
[5] 张圣亮,杨俊,刘彦初.虚拟社区之BBS服务质量实证研究[J]. 世界标准化与质量管理 ,2007(2): 24-29.(Zhang Shengliang, Yang Jun, Liu Yanchu. An Empirical Research on the BBS Service Quality of Virtual Community[J]. World Standardization & Quality Management,2007(2):24-29.)
[6] 王蕾, 房俊民. 网络论坛质量评价的影响因素研究[J]. 情报科学 , 2011,29(11): 1647-1652.(Wang Lei, Fang Junmin. Research on Influence Factors of Online Community Evaluation[J]. Information Science, 2011,29(11):1647-1652.)
[7] Blei D M, Ng A Y, Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research, 2003,3:993-1022.
[8] Blei D M. Probabilistic Topic Models[J].Communications of the ACM, 2012,55(4):77-84.
[9] Wei X,Croft W B. LDA-based Document Models for Ad-hoc Retrieval[C].In: Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.2006:178-185.
[10] 刁宇峰,杨亮,林鸿飞.基于LDA模型的博客垃圾评论发现[J]. 中文信息学报 , 2011,25(1):41-47.(Diao Yufeng, Yang Liang, Lin Hongfei. LDA-based Opinion Spam Discovering[J].Journal of Chinese Information Processing,2011,25(1):41-47.)
[11] 韩晓晖,马军,邵海敏,等.一种基于LDA的Web论坛低质量回帖检测方法[J]. 计算机研究与发展 ,2012,49(9):1937-1946.(Han Xiaohui, Ma Jun, Shao Haimin, et al. An LDA Based Approach to Detect the Low-Quality Reply Posts in Web Forums[J].Journal of Computer Research and Development, 2012,49(9):1937-1946.)
[12] Heinrich G. Parameter Estimation for Text Analysis[R].2005.
[13] Peters G W, Sisson S A. Bayesian Inference, Monte Carlo Sampling and Operational Risk[J]. Journal of Operational Risk, 2006(2):69-104.
[14] Kullback S. Information Theory and Statistics[M].New York: John Wiley and Sons,1959.
[15] 王满,徐朝军.网络课程资源自动量化评价研究[J]. 现代图书情报技术 , 2010(1):88-93.(Wang Man, Xu Chaojun. Study on Automatic Quantitative Evaluation of Web Course Resources[J].New Technology of Library and Information Service,2010(1):88-93.)
[1] 王晰巍,贾若男,韦雅楠,张柳. 多维度社交网络舆情用户群体聚类分析方法研究*[J]. 数据分析与知识发现, 2021, 5(6): 25-35.
[2] 马莹雪,赵吉昌. 自然灾害期间微博平台的舆情特征及演变*——以台风和暴雨数据为例[J]. 数据分析与知识发现, 2021, 5(6): 66-79.
[3] 伊惠芳,刘细文. 一种专利技术主题分析的IPC语境增强Context-LDA模型研究[J]. 数据分析与知识发现, 2021, 5(4): 25-36.
[4] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[5] 张鑫,文奕,许海云. 一种融合表示学习与主题表征的作者合作预测模型*[J]. 数据分析与知识发现, 2021, 5(3): 88-100.
[6] 赵天资, 段亮, 岳昆, 乔少杰, 马子娟. 基于Biterm主题模型的新闻线索生成方法 *[J]. 数据分析与知识发现, 2021, 5(2): 1-13.
[7] 王伟, 高宁, 徐玉婷, 王洪伟. 基于LDA的众筹项目在线评论主题动态演化分析*[J]. 数据分析与知识发现, 2021, 5(10): 103-123.
[8] 陈浩, 张梦毅, 程秀峰. 融合主题模型与决策树的跨地区专利合作关系发现与推荐*——以广东省和武汉市高校专利库为例[J]. 数据分析与知识发现, 2021, 5(10): 37-50.
[9] 蔡永明,刘璐,王科唯. 网络虚拟学习社区重要用户与核心主题联合分析*[J]. 数据分析与知识发现, 2020, 4(6): 69-79.
[10] 余传明,原赛,朱星宇,林虹君,张普亮,安璐. 基于深度学习的热点事件主题表示研究*[J]. 数据分析与知识发现, 2020, 4(4): 1-14.
[11] 叶光辉,曾杰妍,胡婧岚,毕崇武. 城市画像视角下的社会公众情感演化研究*[J]. 数据分析与知识发现, 2020, 4(4): 15-26.
[12] 潘有能,倪秀丽. 基于Labeled-LDA模型的在线医疗专家推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 34-43.
[13] 刘玉文,王凯. 面向地域的网络话题识别方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 173-181.
[14] 黄微,赵江元,闫璐. 网络热点事件话题漂移指数构建与实证研究*[J]. 数据分析与知识发现, 2020, 4(11): 92-101.
[15] 叶光辉,徐彤,毕崇武,李心悦. 基于多维度特征与LDA模型的城市旅游画像演化分析*[J]. 数据分析与知识发现, 2020, 4(11): 121-130.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn