Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (12): 52-57     https://doi.org/10.11925/infotech.1003-3513.2011.12.08
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于Single-Pass的网络话题在线聚类方法研究
朱恒民1,2, 朱卫未2
1. 南京大学信息管理系 南京 210093;
2. 南京邮电大学经济与管理学院 南京 210046
Study on Web Topic Online Clustering Approach Based on Single-Pass Algorithm
Zhu Hengmin1,2, Zhu Weiwei2
1. Department of Information Management, Nanjing University, Nanjing 210093, China;
2. College of Economics & Management, Nanjing University of Posts & Telecommunications, Nanjing 210046, China
全文: PDF (719 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 基于Single-Pass算法思想,研究网络话题的在线聚类方法,以期及时捕捉网络信息的动态变化。在分析该方法聚类流程的基础上,重点研究网络动态信息流的文本特征抽取和权重计算方法,以及话题类表示和更新等关键问题,设计实验对比分析不同的标题中特征加权系数、特征权重计算和标准化方法以及话题类向量维度对话题聚类质量和时间效率的影响。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
朱恒民
朱卫未
关键词 网络舆情话题挖掘在线聚类Single-Pass    
Abstract:In order to get dynamics of Web information timely, an online Web topic clustering approach based on Single-Pass algorithm is researched. The clustering process of this approach is analyzed firstly,and the key problems including extracting and weight calculating of features as well as representation and modification of topic cluster are deliberated. Experiment is designed to compare the effects of different weight factor of features in title, weight calculating and normalizing methods of features and the vector dimension of topic cluster on cluster quality and time efficiency.
Key wordsInternet public opinion    Topic mining    Online clustering    Single-Pass
收稿日期: 2011-09-26      出版日期: 2012-02-02
: 

G353.1

 
基金资助:

本文系江苏省社会科学基金项目“网络舆论危机的生成与预警机制研究”(项目编号:10TQC009)、江苏省教育厅高校哲学社会科学项目“互联网舆情演化的动态网络模型研究”(项目编号:2011SJB870006)和南京邮电大学青蓝计划“网络舆情热点发现及动态预警研究”(项目编号:NY210055)的研究成果之一。

引用本文:   
朱恒民, 朱卫未. 基于Single-Pass的网络话题在线聚类方法研究[J]. 现代图书情报技术, 2011, 27(12): 52-57.
Zhu Hengmin, Zhu Weiwei. Study on Web Topic Online Clustering Approach Based on Single-Pass Algorithm. New Technology of Library and Information Service, 2011, 27(12): 52-57.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.12.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I12/52
[1] 王伟,许鑫. 基于聚类的网络舆情热点发现及分析[J]. 现代图书情报技术,2009(3):74-79.

[2] Trieschnigg D, Kraaij W. Scalable Hierarchical Topic Detection: Exploring a Sample Based Approach[C]. In: Proceedings of the 28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,Salvador,Brazil.2005:655-656.

[3] 朱恒民,马静,黄卫东.基于领域本体的SOM文本逐层聚类方法[J].情报学报,2008,27(6):845-850.

[4] Guha S, Mishra N, Motwani R, et al. Clustering Data Streams[C].In:Proceedings of the Annual Symposium on Foundations of Computer Science.2000:359-366.

[5] Gupta C, Grossman R L. GenIc: A Single Pass Generalized Incremental Algorithm for Clustering[C].In:Proceedings of the 2004 SIAM International Conference on Data Mining, Philadelphia.2004:137-153.

[6] 税仪冬,瞿有利,黄厚宽.周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J].北京交通大学学报,2009,33(5):85-89.

[7] 胡迁乔. 面向中文论坛的网络舆情倾向性分析[D]. 武汉:华中科技大学,2009.
[1] 范涛,王昊,吴鹏. 基于图卷积神经网络和依存句法分析的网民负面情感分析研究*[J]. 数据分析与知识发现, 2021, 5(9): 97-106.
[2] 程铁军, 王曼, 黄宝凤, 冯兰萍. 基于CEEMDAN-BP模型的突发事件网络舆情预测研究*[J]. 数据分析与知识发现, 2021, 5(11): 59-67.
[3] 邓建高,张璇,傅柱,韦庆明. 基于系统动力学的突发事件网络舆情传播研究:以“江苏响水爆炸事故”为例*[J]. 数据分析与知识发现, 2020, 4(2/3): 110-121.
[4] 梁艳平,安璐,刘静. 同类突发公共卫生事件微博话题共振研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 122-133.
[5] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[6] 黄微,赵江元,闫璐. 网络热点事件话题漂移指数构建与实证研究*[J]. 数据分析与知识发现, 2020, 4(11): 92-101.
[7] 梅妍霜,朱恒民,魏静. 媒体协同对网络舆情扩散的作用机制研究*[J]. 数据分析与知识发现, 2019, 3(2): 65-71.
[8] 贾隆嘉, 张邦佐. 高校网络舆情安全中主题分类方法研究*——以新浪微博数据为例[J]. 数据分析与知识发现, 2018, 2(7): 55-62.
[9] 王璟琦, 李锐, 吴华意. 基于空间自相关的网络舆情话题演化时空规律分析*[J]. 数据分析与知识发现, 2018, 2(2): 64-73.
[10] 李真, 丁晟春, 王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[11] 王晰巍, 张柳, 李师萌, 王楠阿雪. 新媒体环境下社会公益网络舆情传播研究* ——以新浪微博“画出生命线”话题为例[J]. 数据分析与知识发现, 2017, 1(6): 93-101.
[12] 丁晟春,龚思兰,李红梅. 基于突发主题词和凝聚式层次聚类的微博突发事件检测研究*[J]. 现代图书情报技术, 2016, 32(7-8): 12-20.
[13] 吴鹏,金贝贝,强韶华. 基于BDI-Agent模型的突发事件网络舆情应急响应建模研究*[J]. 现代图书情报技术, 2016, 32(7-8): 32-41.
[14] 杨小平,马奇凤,余力,莫雨婷,吴佳楠,张悦. 评论簇在网络舆论中的情感倾向代表性研究*[J]. 现代图书情报技术, 2016, 32(7-8): 51-59.
[15] 黄炜,余辉,李岳峰. 国内网络反恐研究的现状、问题和展望*[J]. 现代图书情报技术, 2016, 32(11): 1-10.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn