Please wait a minute...
Advanced Search
数据分析与知识发现
  本期目录 | 过刊浏览 | 高级检索 |
基于改进SMOTE算法与集成学习的舆情反转预测研究
王楠,李海荣,谭舒孺
(吉林财经大学管理科学与信息工程学院 长春  130117)
Research on prediction of public opinion reversal based on improved SMOTE algorithm and ensemble learning
Wang Nan,Li Hairong,Tan Shuru
(School of Management Science and Information Engineering, Jilin University of Finance and Economics, Changchun 130117, China)
全文: PDF (973 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]基于网络舆情事件展开分析,确定其属性特征及分类。当出现新的网络舆情事件时,可提前预测该事件是否会发生反转,既能帮助政府及时调整舆论导向,又能防止政府媒体的公信力受到负面影响。[方法]收集近五年发生的具有代表性的网络舆情事件,设计改进的SMOTE算法对事件数据集进行平衡分布处理,构建基于神经网络集成学习的舆情反转预测模型,并采用精确率、召回率等指标对模型的预测效果进行评估。选取2020年最新发生的网络舆情事件案例对提出的模型进行测试,进一步揭示所构建的反转预测模型的内在机制。[结果]通过实证研究,本文构建的神经网络集成学习分类模型准确率达99%,F值和AUC值均为0.99,验证了模型的可行性和较强的泛化性能。[局限]只选取了舆情反转事件的部分特征进行研究,对未来发生的舆情反转事件表征不够全面。[结论]所构建的舆情反转预测模型可以提前准确预测舆情事件是否会发生反转。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 舆情反转SMOTE算法神经网络集成学习实证研究     
Abstract

[Objective] Based on the analysis of online public opinion events, determining their attribute characteristics and classification. When a new online public opinion event occurs, we can predict whether the event will reverse in advance, which can not only help the government adjust the direction of public opinion in time but also prevent the credibility of the government media from being negatively affected.[Methods] The representative online public opinion events were collected in the past five years. The improved SMOTE algorithm made a balance distribution treatment on the event data set, building the prediction model of online public opinion reversal based on the neural network ensemble learning, and using the indicators such as accuracy rate, recall rate to evaluate the prediction effect of the model. The latest online public opinion events in 2020 are selected to test the proposed model, so as to further reveal the internal mechanism of the constructed reversal prediction model. [Results] Through empirical research, the accuracy of the neural network ensemble learning classification model is 99% and the values of F and AUC are both 0.99, which verifies the feasibility and strong generalization performance of the model.

[Limitations] This paper only selects some characteristics of public opinion reversal events for research. Therefore, it cannot comprehensively represent all public opinion reversal events that will occur in the future. [Conclusions] The constructed public opinion reversal prediction model can accurately predict whether the public opinion event will reverse in advance.


Key words Online public opinion reversal    SMOTE algorithm    Neural network    Ensemble learning    Empirical study
     出版日期: 2020-12-21
ZTFLH:  G353  
引用本文:   
王楠, 李海荣, 谭舒孺. 基于改进SMOTE算法与集成学习的舆情反转预测研究 [J]. 数据分析与知识发现, 10.11925/infotech.2096-3467.2020.0838.
Wang Nan, Li Hairong, Tan Shuru. Research on prediction of public opinion reversal based on improved SMOTE algorithm and ensemble learning . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2020.0838      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 尹浩然,曹金璇,曹鲁喆,王国栋. 扩充语义维度的BiGRU-AM突发事件要素识别研究*[J]. 数据分析与知识发现, 2020, 4(9): 91-99.
[2] 邱尔丽,何鸿魏,易成岐,李慧颖. 基于字符级CNN技术的公共政策网民支持度研究 *[J]. 数据分析与知识发现, 2020, 4(7): 28-37.
[3] 王思迪,胡广伟,杨巳煜,施云. 基于文本分类的政府网站信箱自动转递方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 51-59.
[4] 刘伟江,魏海,运天鹤. 基于卷积神经网络的客户信用评估模型研究*[J]. 数据分析与知识发现, 2020, 4(6): 80-90.
[5] 王末,崔运鹏,陈丽,李欢. 基于深度学习的学术论文语步结构分类方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 60-68.
[6] 闫春,刘璐. 基于改进SOM神经网络模型与RFM模型的非寿险客户细分研究*[J]. 数据分析与知识发现, 2020, 4(4): 83-90.
[7] 苏传东,黄孝喜,王荣波,谌志群,毛君钰,朱嘉莹,潘宇豪. 基于词嵌入融合和循环神经网络的中英文隐喻识别*[J]. 数据分析与知识发现, 2020, 4(4): 91-99.
[8] 徐月梅,刘韫文,蔡连侨. 基于深度融合特征的政务微博转发规模预测模型*[J]. 数据分析与知识发现, 2020, 4(2/3): 18-28.
[9] 向菲,谢耀谈. 基于混合采样与迁移学习的患者评论识别模型*[J]. 数据分析与知识发现, 2020, 4(2/3): 39-47.
[10] 倪维健,郭浩宇,刘彤,曾庆田. 基于多头自注意力神经网络的购物篮推荐方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 68-77.
[11] 彭郴,吕学强,孙宁,张乐,姜肇财,宋黎. 基于CNN的消费品缺陷领域词典构建方法研究*[J]. 数据分析与知识发现, 2020, 4(11): 112-120.
[12] 余本功,汲浩敏. 基于DW-TCI的半监督文本分类方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 58-69.
[13] 陶玥,余丽,张润杰. 科技文献中短语级主题抽取的主动学习方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 134-143.
[14] 余本功,曹雨蒙,陈杨楠,杨颖. 基于nLD-SVM-RF的短文本分类研究*[J]. 数据分析与知识发现, 2020, 4(1): 111-120.
[15] 聂维民,陈永洲,马静. 融合多粒度信息的文本向量表示模型 *[J]. 数据分析与知识发现, 2019, 3(9): 45-52.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn