Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (3): 58-64    DOI: 10.11925/infotech.1003-3513.2013.03.10
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于LDA模型的社交网站自动量化评价研究
王嘉琦, 徐朝军, 李艺
南京师范大学教育科学学院 南京 210097
Quantified Evaluation for Social Networks Based on LDA Model
Wang Jiaqi, Xu Chaojun, Li Yi
School of Educational Science, Nanjing Normal University, Nanjing 210097, China
全文: PDF(749 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 在海量数据背景下,针对社交网站中队成员关系、话题热度及内涵的价值倾向等评价问题,提出一个基于LDA的两阶段社交网站自动量化评价模型。首先通过LDA方法将文本内容映射到主题空间,依据文本所属主题和用户特征来剔除垃圾信息;对于筛选出的信息,从用户、话题和社区三个角度提出一个新的社交网站的量化分析方法。最后,通过对西祠胡同的实验分析验证该模型的有效性和可行性。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王嘉琦
徐朝军
李艺
关键词 社交网络LDA主题模型两阶段评价    
Abstract:As propelled by the rapid growth of text data, it is urgent to utilize automated tools to monitor the user relationship, topic trend and the implying values of the platforms. A new modeling framework based on LDA is proposed to evaluate the social networks automatically. The authors first map the text into topic space, eliminating the uncorrelated information based on topic distribution and user feature, then create an evaluation method from social network analysis perspective, mining the structure of the social network from three aspects including user centrality, topic popularity and community activity. Experiments show that promising results are achieved by the new model.
Key wordsSocial network    LDA    Topic model    Two-stage evaluation
收稿日期: 2013-02-20     
:  TP391  
基金资助:本文系全国教育科学“十一五”规划2009年度教育部青年专项课题“网络课程使用现状自动量化评价系统研究”(项目编号:ECA090441)的研究成果之一。
引用本文:   
王嘉琦, 徐朝军, 李艺. 基于LDA模型的社交网站自动量化评价研究[J]. 现代图书情报技术, 2013, 29(3): 58-64.
Wang Jiaqi, Xu Chaojun, Li Yi. Quantified Evaluation for Social Networks Based on LDA Model. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2013.03.10.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.03.10
[1] Kent State University.Website Evaluation Form[EB/OL].[2012-12-20]. http://www.library.kent.edu/internet/evalform.html.
[2] University of Michigan Law School. The Argus Clearinghouse[EB/OL].[2012-12-20]. http://www.clearinghouse.net.
[3] Jupiter Research Corporation[EB/OL].[2012-12-10]. http://www.jupiterresearch.com.
[4] 李长玲,王效岳,付鑫金.网站定量评价指标体系的构建与权值分配[J]. 图书情报工作 ,2008,52(7): 52-56.(Li Changling, Wang Xiaoyue, Fu xinjin. Construction of Quantitative Evaluation Index System and Weight Assignment for Websites[J].Library and Information Service, 2008,52(7):52-56.)
[5] 张圣亮,杨俊,刘彦初.虚拟社区之BBS服务质量实证研究[J]. 世界标准化与质量管理 ,2007(2): 24-29.(Zhang Shengliang, Yang Jun, Liu Yanchu. An Empirical Research on the BBS Service Quality of Virtual Community[J]. World Standardization & Quality Management,2007(2):24-29.)
[6] 王蕾, 房俊民. 网络论坛质量评价的影响因素研究[J]. 情报科学 , 2011,29(11): 1647-1652.(Wang Lei, Fang Junmin. Research on Influence Factors of Online Community Evaluation[J]. Information Science, 2011,29(11):1647-1652.)
[7] Blei D M, Ng A Y, Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research, 2003,3:993-1022.
[8] Blei D M. Probabilistic Topic Models[J].Communications of the ACM, 2012,55(4):77-84.
[9] Wei X,Croft W B. LDA-based Document Models for Ad-hoc Retrieval[C].In: Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.2006:178-185.
[10] 刁宇峰,杨亮,林鸿飞.基于LDA模型的博客垃圾评论发现[J]. 中文信息学报 , 2011,25(1):41-47.(Diao Yufeng, Yang Liang, Lin Hongfei. LDA-based Opinion Spam Discovering[J].Journal of Chinese Information Processing,2011,25(1):41-47.)
[11] 韩晓晖,马军,邵海敏,等.一种基于LDA的Web论坛低质量回帖检测方法[J]. 计算机研究与发展 ,2012,49(9):1937-1946.(Han Xiaohui, Ma Jun, Shao Haimin, et al. An LDA Based Approach to Detect the Low-Quality Reply Posts in Web Forums[J].Journal of Computer Research and Development, 2012,49(9):1937-1946.)
[12] Heinrich G. Parameter Estimation for Text Analysis[R].2005.
[13] Peters G W, Sisson S A. Bayesian Inference, Monte Carlo Sampling and Operational Risk[J]. Journal of Operational Risk, 2006(2):69-104.
[14] Kullback S. Information Theory and Statistics[M].New York: John Wiley and Sons,1959.
[15] 王满,徐朝军.网络课程资源自动量化评价研究[J]. 现代图书情报技术 , 2010(1):88-93.(Wang Man, Xu Chaojun. Study on Automatic Quantitative Evaluation of Web Course Resources[J].New Technology of Library and Information Service,2010(1):88-93.)
[1] 夏立新,曾杰妍,毕崇武,叶光辉. 基于LDA主题模型的用户兴趣层级演化研究 *[J]. 数据分析与知识发现, 2019, 3(7): 1-13.
[2] 曾庆田,胡晓慧,李超. 融合主题词嵌入和网络结构分析的主题关键词提取方法 *[J]. 数据分析与知识发现, 2019, 3(7): 52-60.
[3] 关鹏,王曰芬,傅柱. 基于LDA的主题语义演化分析方法研究 * ——以锂离子电池领域为例[J]. 数据分析与知识发现, 2019, 3(7): 61-72.
[4] 仇丽青,贾玮,范鑫. 基于重叠社区的影响力最大化算法 *[J]. 数据分析与知识发现, 2019, 3(7): 94-102.
[5] 余本功,陈杨楠,杨颖. 基于nBD-SVM模型的投诉短文本分类*[J]. 数据分析与知识发现, 2019, 3(5): 77-85.
[6] 席林娜,窦永香. 基于计划行为理论的微博用户转发行为影响因素研究*[J]. 数据分析与知识发现, 2019, 3(2): 13-20.
[7] 张杰,赵君博,翟东升,孙宁宁. 基于主题模型的微藻生物燃料产业链专利技术分析*[J]. 数据分析与知识发现, 2019, 3(2): 52-64.
[8] 刘俊婉,龙志昕,王菲菲. 基于LDA主题模型与链路预测的新兴主题关联机会发现研究*[J]. 数据分析与知识发现, 2019, 3(1): 104-117.
[9] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[10] 何跃,丰月,赵书朋,马玉凤. 基于知乎问答社区的内容推荐研究——以物流话题为例[J]. 数据分析与知识发现, 2018, 2(9): 42-49.
[11] 张涛,马海群. 一种基于LDA主题模型的政策文本聚类方法研究*[J]. 数据分析与知识发现, 2018, 2(9): 59-65.
[12] 徐艳华,苗雨洁,苗琳,吕学强. 基于LDA模型的HSK作文生成*[J]. 数据分析与知识发现, 2018, 2(9): 80-87.
[13] 伍杰华,沈静,周蓓. 基于迁移成分分析的多层社交网络链接分类*[J]. 数据分析与知识发现, 2018, 2(9): 88-99.
[14] 曾子明,杨倩雯. 基于LDA和AdaBoost多特征组合的微博情感分析*[J]. 数据分析与知识发现, 2018, 2(8): 51-59.
[15] 庞贝贝,苟娟琼,穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn