Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. 3 Issue (3): 74-79     https://doi.org/10.11925/infotech.1003-3513.2009.03.13
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于聚类的网络舆情热点发现及分析*
王伟 许鑫
(华东师范大学信息学系 上海 200241)
Online Public Opinion Hotspot Detection and Analysis Based on Document Clustering
Wang Wei  Xu Xin
(Department of InformaticsEast China Normal University,Shanghai 200241,China)
全文: PDF (557 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量,使网络舆情分析更为准确可靠。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王伟
许鑫
关键词 网络舆情热点发现舆情分析文本聚类    
Abstract

According to the requirement of online public opinion analysis, this paper builds an online public opinion hotspot detection and analysis system based on document clustering. It builds vector space model by abstracting document features from sample Web pages, and get the hot-spot cluster by OPTICS algorithm. According the vector of hot-spot cluster, the Web pages are clustered for the second time. At last, it gets the time evolution mode about the public opinion to afford decision support for specific field,and improves the quality of page correlation and analyze the public opinion more accurately.

Key wordsOnline public opinion    Hotspot Detection    Public opinion analysis    Document clustering
收稿日期: 2009-01-12      出版日期: 2009-03-25
: 

G353.1

 
基金资助:

* 本文系教育部人文社会科学研究项目“互联网舆情信息分析与管理机制研究”(项目编号:08JC870003)的研究成果之一。

通讯作者: 王伟     E-mail: asdwangwei@yahoo.com.cn
作者简介: 王伟,许鑫
引用本文:   
王伟,许鑫. 基于聚类的网络舆情热点发现及分析*[J]. 现代图书情报技术, 2009, 3(3): 74-79.
Wang Wei,Xu Xin. Online Public Opinion Hotspot Detection and Analysis Based on Document Clustering. New Technology of Library and Information Service, 2009, 3(3): 74-79.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.03.13      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V3/I3/74

[1] 中国互联网络信息中心.第22次中国互联网络发展状况统计报告[EB/OL].[2008-07-23].http://www.cnnic.cn/uploadfiles/pdf/2008/7/23/170516.pdf.
[2] 李晓黎. WEB信息检索与分类中的数据采掘研究[D].北京:中国科学院计算技术研究所,2001:61-90.
[3] ICTCLAS简介[EB/OL]. [2008-12-01].http://ictclas.org/sub_1_1.html.
[4] 姚清耘.基于向量空间模型的中文文本聚类方法的研究[D].上海:上海交通大学,2008.
[5] 孙学刚,陈群秀,马亮.基于主题的Web文档聚类研究[J].中文信息学报,2003(3):12-16.
[6] 郭建永,蔡永,甑艳霞.基于文本聚类技术的主题发现[J].计算机工程与设计,2008(6):1426-1428.
[7] 徐文海,温有奎.一种基于TFIDF方法的中文关键词抽取算法[J].信息系统,2008(2):298-301.
[8] 刘群,李素建.基于《知网》的词汇语义相似度计算[A].第三届汉语词汇语义学研讨会,2002.

[1] 范涛,王昊,吴鹏. 基于图卷积神经网络和依存句法分析的网民负面情感分析研究*[J]. 数据分析与知识发现, 2021, 5(9): 97-106.
[2] 程铁军, 王曼, 黄宝凤, 冯兰萍. 基于CEEMDAN-BP模型的突发事件网络舆情预测研究*[J]. 数据分析与知识发现, 2021, 5(11): 59-67.
[3] 梁野,李小元,许航,胡伊然. CLOpin:一种面向舆情分析与预警领域的跨语言知识图谱架构*[J]. 数据分析与知识发现, 2020, 4(6): 1-14.
[4] 邓建高,张璇,傅柱,韦庆明. 基于系统动力学的突发事件网络舆情传播研究:以“江苏响水爆炸事故”为例*[J]. 数据分析与知识发现, 2020, 4(2/3): 110-121.
[5] 梁艳平,安璐,刘静. 同类突发公共卫生事件微博话题共振研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 122-133.
[6] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[7] 黄微,赵江元,闫璐. 网络热点事件话题漂移指数构建与实证研究*[J]. 数据分析与知识发现, 2020, 4(11): 92-101.
[8] 赵华茗,余丽,周强. 基于均值漂移算法的文本聚类数目优化研究 *[J]. 数据分析与知识发现, 2019, 3(9): 27-35.
[9] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[10] 梅妍霜,朱恒民,魏静. 媒体协同对网络舆情扩散的作用机制研究*[J]. 数据分析与知识发现, 2019, 3(2): 65-71.
[11] 张涛, 马海群. 一种基于LDA主题模型的政策文本聚类方法研究*[J]. 数据分析与知识发现, 2018, 2(9): 59-65.
[12] 贾隆嘉, 张邦佐. 高校网络舆情安全中主题分类方法研究*——以新浪微博数据为例[J]. 数据分析与知识发现, 2018, 2(7): 55-62.
[13] 王秀芳, 盛姝, 路燕. 一种基于话题聚类及情感强度的微博舆情分析模型*[J]. 数据分析与知识发现, 2018, 2(6): 37-47.
[14] 王璟琦, 李锐, 吴华意. 基于空间自相关的网络舆情话题演化时空规律分析*[J]. 数据分析与知识发现, 2018, 2(2): 64-73.
[15] 李真, 丁晟春, 王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn