Please wait a minute...
Advanced Search
数据分析与知识发现  2018, Vol. 2 Issue (2): 64-73     https://doi.org/10.11925/infotech.2096-3467.2017.0929
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于空间自相关的网络舆情话题演化时空规律分析*
王璟琦1, 李锐1,2(), 吴华意1,2
1(武汉大学测绘遥感信息工程国家重点实验室 武汉 430079)
2(地球空间信息技术协同创新中心 武汉 430079)
The Evolution of Online Public Opinion Based on Spatial Autocorrelation
Wang Jingqi1, Li Rui1,2(), Wu Huayi1,2
1(State Key Laboratory of Surveying, Mapping and Remote Sensing, Wuhan University, Wuhan 430079, China)
2(Collaborative Innovation Center of Geospatial Technology, Wuhan 430079, China)
全文: PDF (2194 KB)   HTML ( 4
输出: BibTeX | EndNote (RIS)      
摘要 

目的】研究网络舆情话题演化中存在的时空分布规律, 正确把握网络舆情的发展态势。【方法】基于LDA模型提取网络舆情话题并定义话题强度定量测度指标; 基于空间自相关理论分析不同区域话题强度空间分布及其时间变化规律, 并采用Moran’s I统计量对空间聚集性进行度量; 以“旅游”话题为例, 研究网络舆情话题演化的时空规律。【结果】网络舆情话题强度的空间分布具有聚集性, 聚集性随话题强度的升高而增强, 表现为全局Moran’s I统计量随话题强度的升高而升高, 并且存在话题强度的局部热点区域和异常高值与低值。【局限】数据来源较为单一, 研究结果的普适性有待提升。【结论】本文提出的网络舆情话题演化定量分析方法, 可以有效挖掘网络舆情话题演化的时空规律, 为舆情监测预警提供更为科学的决策支持。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王璟琦
李锐
吴华意
关键词 空间自相关Moran’s I统计量LDA模型话题演化网络舆情    
Abstract

[Objective] This paper aims to investigate the evolution of online public opinion by analyzing the spatial-temporal distribution patterns of topic evolution. [Methods] First, we used the LDA model to extract topics from news and then calculated the quantitative topic intensity index to measure their popularity. Second, we adopted spatial autocorrelation method to examine the distribution of topic intensity on “tourism” as well as its changes over time based on Moran’s I Index. [Results] The global distribution of topic intensity was clustered and characterized by the global Moran’s I index. The local distribution of topic intensity had hot spots, abnormal high values and low values. [Limitations] Only collected data from Xinhuanet, which might yield in-complete results. [Conclusions] The proposed method could effectively extract the spatial-temporal patterns of online public opinion, which improves the decision-making and early warning mechanism.

Key wordsSpatial Autocorrelation    Moran’s I Index    LDA Model    Topic Evolution    Internet Public Opinion
收稿日期: 2017-09-18      出版日期: 2018-03-07
ZTFLH:  G350 K901  
基金资助:*本文系国家重点研发计划项目“全空间信息系统建模理论”(项目编号: 2016YFB0502301)、国家自然科学基金资助项目“云GIS中区域特征的用户行为研究及服务资源需求预测”(项目编号: 41771426)和测绘遥感信息工程国家重点实验室专项科研经费资助的研究成果之一
引用本文:   
王璟琦, 李锐, 吴华意. 基于空间自相关的网络舆情话题演化时空规律分析*[J]. 数据分析与知识发现, 2018, 2(2): 64-73.
Wang Jingqi,Li Rui,Wu Huayi. The Evolution of Online Public Opinion Based on Spatial Autocorrelation. Data Analysis and Knowledge Discovery, 2018, 2(2): 64-73.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.0929      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2018/V2/I2/64
  每小时内的数据量分布图
话题编号 话题名称 话题特征词
5 原油市场 原油 建议 操作 行情 市场 美国 止损 目标 油价 数据
6 食品安全 食品 产品 消费者 生产 销售 安全 市场 召回 餐饮 质量
9 党风党纪 问题 干部 违规 党员 监督 书记 单位 纪委 中央 纪律
11 楼市 房地产 城市 市场 政策 楼市 调控 房价 价格 住房 限购
12 扶贫 工作 扶贫 建设 发展 群众 开展 改革 落实 脱贫 社会
15 犯罪 犯罪 法院 案件 机关 法律 公安 诈骗 执行 电信 工作
16 道路交通 交通 记者 小区 道路 车辆 施工 进行 工程 建筑 市民
17 旅游 游客 旅游 景区 机场 交通 公园 公交 出行 线路 旅客
20 金融市场 公司 市场 企业 金融 投资 中国 银行 增长 行业 资金
22 教育 学生 教育 学校 高校 大学生 大学 教师 培训 学院 毕业生
  舆情话题及特征词汇集提取结果
  旅游话题强度时间序列图(2016年)
时间段 日期 节假日时间段
t1 9.12-9.14 中秋节前
t2 9.15-9.18 中秋节
t3 9.19-9-22 中秋节后
t4 9.23-9.30 国庆节前
t5 10.1-10.8 国庆节
t6 10.9-10.16 国庆节后
  时间段划分(2016年)
时间段 t1 t2 t3 t4 t5 t6
全局Moran’s I 0.0826 0.1164 0.1544 0.1119 0.1275 0.0769
Z-score 6.63 9.31 12.34 8.94 10.16 6.18
P-Value 0 0 0 0 0 0
  全局统计量及检验值
  各时间段话题强度局部聚集类型分布图
聚集类型 t1 t2 t3 t4 t5 t6
HH 66 89 113 101 113 71
HL 28 30 24 33 41 30
LH 3 3 8 9 8 15
LL 0 0 0 0 0 0
Not Significant 2 382 2 357 2 334 2 336 2 317 2 363
  聚集区域数量统计表
[1] 朱恒民, 苏新宁, 张相斌, 等. 互联网舆情演化的动态网络模型研究[J]. 情报理论与实践, 2010, 33(10): 75-78.
[1] (Zhu Hengmin, Su Xinning, Zhang Xiangbin, et al.The Evolution Analysis of Online Public Opinion Based on Dynamic Network Model[J]. Information Studies: Theory & Application, 2010, 33(10): 75-78.)
[2] 洪宇, 张宇, 刘挺, 等. 话题检测与跟踪的评测及研究综述[J]. 中文信息学报, 2007, 21(6): 71-87.
doi: 10.3969/j.issn.1003-0077.2007.06.011
[2] (Hong Yu, Zhang Yu, Liu Ting, et al.Topic Detection and Tracking Review[J]. Journal of Chinese Information Processing, 2007, 21(6): 71-87.)
doi: 10.3969/j.issn.1003-0077.2007.06.011
[3] 林萍, 黄卫东. 基于LDA模型的网络舆情事件话题演化分析[J]. 情报杂志, 2013, 32(12): 26-30.
[3] (Lin Ping, Huang Weidong.Event Topic Evolution of Network Public Opinions: An Analysis Based on LDA Model[J]. Journal of Intelligence, 2013, 32(12): 26-30.)
[4] 王来华, 张丽红. 略论舆情空间[J]. 理论与现代化, 2008(3): 91-94.
[4] (Wang Laihua, Zhang Lihong.Public Opinion Space[J]. Theory and Modernization, 2008 (3): 91-94.)
[5] Sanderson M, Kohler J.Analyzing Geographic Queries[C]// Proceedings of SIGIR Workshop on Geographic Information Retrieval.2004.
[6] 万源. 基于语义统计分析的网络舆情挖掘技术研究[D]. 武汉: 武汉理工大学, 2012.
[6] (Wan Yuan.Research on Mining of Internet Public Opinion Based on Semantic and Statistic Analysis [D]. Wuhan: Wuhan University of Technology, 2012.)
[7] 蒋锴. 含地理位置信息的社交媒体挖掘及应用[D]. 合肥: 中国科学技术大学, 2014.
[7] (Jiang Kai.Geo-referenced Social Media Mining and Its Application [D]. Hefei: University of Science and Technology of China, 2014.)
[8] 王劲峰, 葛咏, 李连发, 等. 地理学时空数据分析方法[J]. 地理学报, 2014, 69(9): 1326-1345.
doi: 10.11821/dlxb201409007
[8] (Wang Jinfeng, Ge Yong, Li Lianfa, et al.Spatiotemporal Data Analysis in Geography[J]. Acta Geographica Sinica, 2014, 69(9): 1326-1345.)
doi: 10.11821/dlxb201409007
[9] Blei D M, Ng A Y, Jordan M I.Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[10] 单斌, 李芳. 基于LDA话题演化研究方法综述[J]. 中文信息学报, 2010, 24(6): 43-49, 68.
doi: 10.3969/j.issn.1003-0077.2010.06.007
[10] (Shan Bin, Li Fang.A Survey of Topic Evolution Based on LDA[J]. Journal of Chinese Information Processing, 2010, 24(6): 43-49, 68.)
doi: 10.3969/j.issn.1003-0077.2010.06.007
[11] 赵爱华, 刘培玉, 郑燕. 基于LDA的新闻话题子话题划分方法[J]. 小型微型计算机系统, 2013, 34(4): 732-737.
[11] (Zhao Aihua, Liu Peiyu, Zheng Yan.Subtopic Division in News Topic Based on Latent Dirichlet Allocation[J]. Journal of Chinese Computer Systems, 2013, 34(4): 732-737.)
[12] 王少鹏, 彭岩, 王洁, 等. 基于LDA的文本聚类在网络舆情分析中的应用研究[J]. 山东大学学报: 理学版, 2014, 49(9): 129-134.
[12] (Wang Shaopeng, Peng Yan, Wang Jie, et al.Research of the Text Clustering Based on LDA Using in Network Public Opinion Analysis[J]. Journal of Shandong University: Natural Science, 2014, 49(9): 129-134.)
[13] 史剑虹, 陈兴蜀, 王文贤. 基于隐主题分析的中文微博话题发现[J]. 计算机应用研究, 2014, 31(3): 700-704.
[13] (Shi Jianhong, Chen Xingshu, Wang Wenxian.Discovering Topic from Chinese Microblog Based on Hidden Topics Analysis[J]. Application Research of Computers, 2014, 31(3): 700-704.)
[14] 曹丽娜, 唐锡晋. BBS话题的地理分布分析[J]. 系统科学与数学, 2016, 36(5): 671-682.
[14] (Cao Li’na, Tang Xijin.Analysis of Topics Distribution in Geography Based on BBS[J]. Journal of Systems Science and Mathematical Sciences, 2016, 36(5): 671-682.)
[15] 王艳东, 李昊, 王腾, 等. 基于社交媒体的突发事件应急信息挖掘与分析[J]. 武汉大学学报: 信息科学版, 2016, 41(3): 290-297.
doi: 10.13203/j.whugis20140804
[15] (Wang Yandong, Li Hao, Wang Teng, et al.The Mining and Analysis of Emergency Information in Sudden Events Based on Social Media[J]. Geomatics and Information Science of Wuhan University, 2016, 41(3): 290-297.)
doi: 10.13203/j.whugis20140804
[16] 陈涛, 林杰. 基于搜索引擎关注度的网络舆情时空演化比较分析——以谷歌趋势和百度指数比较为例[J]. 情报杂志, 2013, 32(3): 7-10, 16.
[16] (Chen Tao, Lin Jie.Comparative Analysis of Temporal-Spatial Evolution of Online Public Opinion Based on Search Engine Attention — Cases of Google Trends and Baidu Index[J]. Journal of Intelligence, 2013, 32(3): 7-10, 16.)
[17] 刘国巍, 程国辉, 姜金贵, 等. 时空分异视角下非常规突发事件网络舆情演化研究——以“上海12.31踩踏事件”为例[J]. 情报杂志, 2015, 34(6): 126-130, 150.
doi: 10.3969/j.issn.1002-1965.2015.06.023
[17] (Liu Guowei, Cheng Guohui, Jiang Jingui, et al.On the Evolution of the Unconventional Emergency Network Public Opinion from the Perspective of Spatial-temporal Differentiation — Taking “Shanghai 12.31 Stampede” as an Example[J]. Journal of Intelligence, 2015, 34(6): 126-130, 150.)
doi: 10.3969/j.issn.1002-1965.2015.06.023
[18] Heinrich G.Parameter Estimation for Text Analysis [R]. vsonix GmbH and University of Leipzig, 2008.
[19] 崔凯. 基于LDA的主题演化研究与实现[D]. 长沙: 国防科学技术大学, 2010.
[19] (Cui Kai.The Research and Implementation of Topic Evolution Based on LDA [D]. Changsha: National University of Defense Technology, 2010.)
[20] Odland J.Spatial Autocorrelation[M]. London: SAGE Publications, 1988.
[21] 秦昆. GIS空间分析理论与方法[M]. 第二版. 武汉: 武汉大学出版社, 2010.
[21] (Qin Kun.Theories and Methods of Spatial Analysis in GIS [M]. The 2nd Edition. Wuhan: Wuhan University Press, 2010.)
[22] 宋雪娟. 西安市住宅价格空间分异与时空演变规律分析[D]. 西安: 陕西师范大学, 2011.
[22] (Song Xuejuan.Spatial and Temporal Evolution Analysis of Housing Prices in Xi’an[D]. Xi’an: Shaanix Normal University, 2011.)
[23] Anselin L.Local Indicators of Spatial Association—LISA[J]. Geographical Analysis, 1995, 27(2): 93-115.
doi: 10.1111/j.1538-4632.1995.tb00338.x
[24] 张华平. NLPIR汉语分词系统[EB/OL]. [2016-08-17]. .
[24] (Zhang Huaping. NLPIR Chinese Word Segmentation System [EB/OL]. [2016-08-17].
[25] 中华人民共和国国家统计局. 最新县及县以上行政区划代码(截止2016年7月31日)[DB/OL]. [2016-08-17]. .
[25] (National Bureau of Statistics of China. Code of Administrative Divisions of County Level or above (by July 31, 2016) [DB/OL]. [2016-08-17].
[26] ESRI. ArcGIS[EB/OL]. [2016-08-01]. .
[1] 蔡永明,刘璐,王科唯. 网络虚拟学习社区重要用户与核心主题联合分析*[J]. 数据分析与知识发现, 2020, 4(6): 69-79.
[2] 邓建高,张璇,傅柱,韦庆明. 基于系统动力学的突发事件网络舆情传播研究:以“江苏响水爆炸事故”为例*[J]. 数据分析与知识发现, 2020, 4(2/3): 110-121.
[3] 梁艳平,安璐,刘静. 同类突发公共卫生事件微博话题共振研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 122-133.
[4] 刘玉文,王凯. 面向地域的网络话题识别方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 173-181.
[5] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[6] 邵云飞,刘东苏. 基于类别特征扩展的短文本分类方法研究 *[J]. 数据分析与知识发现, 2019, 3(9): 60-67.
[7] 张佩瑶,刘东苏. 基于词向量和BTM的短文本话题演化分析*[J]. 数据分析与知识发现, 2019, 3(3): 95-101.
[8] 汪鸿沁泠,巴志超,李纲. 微信群会话话题强度计算及演化分析*[J]. 数据分析与知识发现, 2019, 3(2): 33-42.
[9] 梅妍霜,朱恒民,魏静. 媒体协同对网络舆情扩散的作用机制研究*[J]. 数据分析与知识发现, 2019, 3(2): 65-71.
[10] 李纲,陈思菁,毛进,谷岩松. 自然灾害事件微博热点话题的时空对比分析 *[J]. 数据分析与知识发现, 2019, 3(11): 1-15.
[11] 何跃,丰月,赵书朋,马玉凤. 基于知乎问答社区的内容推荐研究——以物流话题为例[J]. 数据分析与知识发现, 2018, 2(9): 42-49.
[12] 徐艳华,苗雨洁,苗琳,吕学强. 基于LDA模型的HSK作文生成*[J]. 数据分析与知识发现, 2018, 2(9): 80-87.
[13] 贾隆嘉,张邦佐. 高校网络舆情安全中主题分类方法研究*——以新浪微博数据为例[J]. 数据分析与知识发现, 2018, 2(7): 55-62.
[14] 李真, 丁晟春, 王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[15] 王晰巍, 张柳, 李师萌, 王楠阿雪. 新媒体环境下社会公益网络舆情传播研究* ——以新浪微博“画出生命线”话题为例[J]. 数据分析与知识发现, 2017, 1(6): 93-101.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn