Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (4): 66-71     https://doi.org/10.11925/infotech.1003-3513.2010.04.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于改进蚁群聚类的热点主题发现算法研究*
陆蓓,程肖,谌志群
(杭州电子科技大学计算机应用技术研究所杭州 310018)
Research on the Hot Topics Discovery Algorithm Based on Improved Ant Colony Clustering
 Lu  Bei, Cheng  Xiao, Chen  Zhi-Qun
(Institute of Computer Application Technology, Hangzhou Dianzi University, Hangzhou 310018, China)
全文: PDF (632 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对热点主题发现是在聚类算法的基础上实现的特点,将改进后的蚁群聚类算法引入到该研究中,同时提出类别关注度(CAD)的概念,以此来判定类别的热门程度并区分出热门类别和冷门类别,在此基础上抽取热点主题集。实验结果表明改进后的蚁群聚类算法对热点主题的发现有一定的效果,对其他仿生优化聚类算法的引入有借鉴意义。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
陆蓓
程肖
谌志群
关键词 网络舆情  蚁群聚类  热门类别  主题    
Abstract

For the hot topics found is based on the clustering algorithm,this paper introduces the improved ant colony clustering algorithm,and raises Class Attention Degree (CAD) concept in order to determine the class of hot level and to distinguish popular categories as well as unpopular categories. Meanwhile,hot topic set is erxtracted on this basis. Experimental results show that the improved ant colony clustering algorithm has in certain effects to the hot topics found.

Key wordsOnline public opinion      Ant-clustering      Hot categories      Topic
收稿日期: 2010-03-22      出版日期: 2010-04-25
: 

G353.1

 
基金资助:

*本文系教育部人文社会科学研究项目“大规模汉语文本知识挖掘关键技术研究”(项目编号:08JC740011)的研究成果之一。

通讯作者: 程肖     E-mail: chx230861@126.com
引用本文:   
陆蓓 程肖 谌志群. 基于改进蚁群聚类的热点主题发现算法研究*[J]. 现代图书情报技术, 2010, 26(4): 66-71.
Lu Bei, Cheng Xiao, Chen Zhi-Qun. Research on the Hot Topics Discovery Algorithm Based on Improved Ant Colony Clustering. New Technology of Library and Information Service, 2010, 26(4): 66-71.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.04.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I4/66

[1] 第24次中国互联网络发展状况调查统计报告[EB/OL]. (2009-07-16).[2010-02-22]. http://research.cnnic.cn.
[2] 陆蓓,程肖,谌志群.互联网舆情挖掘研究综述[J].情报资料工作,2010(2):41-45.
[3] Allan J. Topic Detection and Tracking:Event-based Information Organization [M].Kluwer Academic Publishers,2002.
[4] Lumer E D, Faieta B. Diversity and Adaptation in Populations of Clustering Ants[C].In:Proceedings of the 3rd International Conference on Simulation of Adaptive Behavior:From Animals to Animals. 1994:501- 508.
[5] 鄢文晋.蚁群算法及其在数据挖掘中的应用[D].重庆:重庆大学,2007.
[6] 曾海群.蚁群聚类算法研究[D].长沙:中南大学,2008.
[7] 莫锦萍,陈琴,马琳,等.一种新的K-Means蚁群聚类算法[J].广西社会科学院学报,2008,24(4):102-104.
[8] 段海滨.蚁群算法原理及其应用[M].北京:科学出版社,2007:290-297.
[9] 吴斌,郑毅,傅伟鹏,等. 一种基于群体智能的客户行为分析算法[J].计算机学报, 2003, 26(8):913-918.
[10] 李保利,俞士汶.话题识别与跟踪研究[J].计算机工程与应用,2003,39(17):7-10.
[11] 罗亚平,王枞,周延泉.基于关注度的热点话题发现模型[C].见:第七届中文信息处理国际会议论文集.武汉:中国中文信息学会,2007:402-408.
[12] 曾依灵,许洪波.网络热点信息发现研究[J].通信学报,2007,28(12):141-146.
[13] 刘星星,何婷婷,龚海军,等.网络热点事件发现系统的设计[J].中文信息学报,2008,22(6):80-85.

[1] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[2] 伊惠芳,刘细文. 一种专利技术主题分析的IPC语境增强Context-LDA模型研究[J]. 数据分析与知识发现, 2021, 5(4): 25-36.
[3] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[4] 沈思,李沁宇,叶媛,孙豪,叶文豪. 基于TWE模型的医学科技报告主题挖掘及演化分析研究*[J]. 数据分析与知识发现, 2021, 5(3): 35-44.
[5] 张鑫,文奕,许海云. 一种融合表示学习与主题表征的作者合作预测模型*[J]. 数据分析与知识发现, 2021, 5(3): 88-100.
[6] 赵天资, 段亮, 岳昆, 乔少杰, 马子娟. 基于Biterm主题模型的新闻线索生成方法 *[J]. 数据分析与知识发现, 2021, 5(2): 1-13.
[7] 张金柱, 于文倩. 基于短语表示学习的主题识别及其表征词抽取方法研究[J]. 数据分析与知识发现, 2021, 5(2): 50-60.
[8] 王伟, 高宁, 徐玉婷, 王洪伟. 基于LDA的众筹项目在线评论主题动态演化分析*[J]. 数据分析与知识发现, 2021, 5(10): 103-123.
[9] 胡广伟, 滕婕, 刘露. 政民互动中社会诉求主题挖掘和省际差异研究*——基于省级政府领导电子信箱语料的分析[J]. 数据分析与知识发现, 2021, 5(10): 15-27.
[10] 陈浩, 张梦毅, 程秀峰. 融合主题模型与决策树的跨地区专利合作关系发现与推荐*——以广东省和武汉市高校专利库为例[J]. 数据分析与知识发现, 2021, 5(10): 37-50.
[11] 邵琦,牟冬梅,王萍,靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究*[J]. 数据分析与知识发现, 2020, 4(9): 68-80.
[12] 盛嘉祺, 许鑫. 融合主题相似度与合著网络的学者标签扩展方法研究*[J]. 数据分析与知识发现, 2020, 4(8): 75-85.
[13] 岳丽欣,刘自强,胡正银. 面向趋势预测的热点主题演化分析方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 22-34.
[14] 蔡永明,刘璐,王科唯. 网络虚拟学习社区重要用户与核心主题联合分析*[J]. 数据分析与知识发现, 2020, 4(6): 69-79.
[15] 刘萍,彭小芳. 基于形式概念分析的词汇相似度计算*[J]. 数据分析与知识发现, 2020, 4(5): 66-74.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn