Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (6): 78-84     https://doi.org/10.11925/infotech.1003-3513.2015.06.12
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于决策树的网络伪舆情识别研究
赵静娴
天津科技大学经济与管理学院 天津 300222
Detect of Internet Fake Public Opinion Based on Decision Tree
Zhao Jingxian
School of Economics and Management, Tianjin University of Science & Technology, Tianjin 300222, China
全文: PDF (602 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

目的】针对舆情的识别问题, 提出一种基于组合优化决策树的伪舆情识别方法。【方法】在特征分析的基础上, 给出A、B、C三类伪舆情的定义。构建伪舆情评价指标体系, 并通过对评价指标离散化, 以归一输入输出关联值为属性选择标准建立决策树。【结果】基于Matlab实现, 通过实验证明利用组合优化决策树所构建的伪舆情识别模型能够达到较高的预测准确率。【局限】模型和数据偏重固定网络媒介, 移动社交软件等新兴网络媒介的兴起可能改变伪舆情特征, 从而需要对方法做进一步改进。【结论】提供一种对多分类伪舆情进行智能识别的新方法。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
赵静娴
关键词 伪舆情评价指标数据挖掘决策树    
Abstract

[Objective] A method to detect Internet fake public opinion based on combined optimization decision tree is proposed. [Methods] It gives three definitions of fake public opinion based on the analysis of characteristics, namely A, B and C. Evaluation index is constructed and decision tree is established by discretization, attributes selection of normalization input-output correlation value. [Results] The test on Matlab shows the model based on combined optimization decision tree has higher predict accuracy. [Limitations] The model and data focus on network media. The rise of mobile social software may change the features of fake public opinion which needs further improvement to the method. [Conclusions] The paper proposes a new method for intelligent multiple classification of fake public opinion.

Key wordsFake public opinion    Evaluation index    Data mining    Decision tree
收稿日期: 2014-12-22      出版日期: 2015-07-08
:  G202  
通讯作者: 赵静娴, ORCID: 0000-0003-1014-4676, E-mail: nzjx2012@163.com。     E-mail: nzjx2012@163.com
引用本文:   
赵静娴. 基于决策树的网络伪舆情识别研究[J]. 现代图书情报技术, 2015, 31(6): 78-84.
Zhao Jingxian. Detect of Internet Fake Public Opinion Based on Decision Tree. New Technology of Library and Information Service, 2015, 31(6): 78-84.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.06.12      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2015/V31/I6/78

[1] 李兰玉. 网络伪舆情的成因及对策分析[J]. 人民论坛, 2013(17): 42-43. (Li Lanyu. The Reasons and Strategies for Internet Fake Public Opinion [J]. People's Tribune, 2013(17): 42-43.)
[2] 宋常青. “网络伪舆情”干扰政府决策[J]. 青年记者, 2010(6): 39. (Song Changqing. Raise Guard on Fake Internet Opinion Interfere with Government Decisions [J]. Youth Journalist, 2010(6): 39.)
[3] 刘勘, 朱怀萍, 胡航. 网络伪舆情的特征研究[J]. 情报杂志, 2011, 30(11): 57-60. (Liu Kan, Zhu Huaiping, Hu Hang. Study on Characteristics of Internet Fake Public Opinion[J]. Journal of Intelligence, 2011, 30(11): 57-60.)
[4] 方付建. 网络伪舆情的表现、成因与影响[J]. 电子政务, 2013(11): 23-28. (Fang Fujian. Manifestations, Causes and Effects of Fake Internet Opinion [J]. E-Government, 2013(11): 23-28.)
[5] 孟美任, 丁晟春. 在线中文商品评论可信度研究[J]. 现代图书情报技术, 2013(9): 60-66. (Meng Meiren, Ding Shengchun. Research on the Credibility of Online Chinese Product Reviews [J]. New Technology of Library and Information Service, 2013(9): 60-66.)
[6] 陈燕方, 李志宇. 基于评论产品属性情感倾向评估的虚假评论识别研究[J]. 现代图书情报技术, 2014(9): 81-90. (Chen Yanfang, Li Zhiyu. Research on Product Review Attribute-Based of Emotion Evaluate Review Spam Detection [J]. New Technology of Library and Information Service, 2014(9): 81-90.)
[7] 刘勘, 朱怀萍, 刘秀芹. 基于支持向量机的网络伪舆情识别研究[J]. 现代图书情报技术, 2013(11): 75-80. (Liu Kan, Zhu Huaiping, Liu Xiuqin. Detection of Internet Deceptive Opinion Based on SVM [J]. New Technology of Library and Information Service, 2013(11): 75-80.)
[8] 杨永军. 社会舆情监测与预警的指标体系研究[J]. 现代传播, 2014(9): 63-71. (Yang Yongjun. Research on Index System of Social Public Opinion Monitoring and Early Warning [J]. Modern Communication, 2014(9): 63-71.)
[9] 冯江平, 张月, 赵舒贞, 等. 网络舆情评价指标体系的构建与应用[J].云南师范大学学报: 哲学社会科学版, 2014, 46(2): 75-84. (Feng Jiangping, Zhang Yue, Zhao Shuzhen, et al. Construction and Application of the Evaluation System of Internet Public Opinion [J]. Journal of Yunnan Normal University: Humaitles and Social Sciences, 2014, 46(2): 75-84.)
[10] 孙玲芳, 周加波, 林伟健, 等. 基于BP神经网络和遗传算法的网络舆情危机预警研究[J]. 情报杂志, 2014, 33(11): 18-24. (Sun Lingfang, Zhou Jiabo, Lin Weijian, et al. On Network Public Opinion Crisis Early Warning Based on the BP Neural Network and Genetic Algorithm [J]. Journal of Intelligence, 2014, 33(11): 18-24.)
[11] 赵静娴, 倪春鹏, 詹原瑞, 等. 一种大规模数据库的组合优化决策树算法[J]. 系统工程与电子技术, 2009, 31(3): 583-587. (Zhao Jingxian, Ni Chunpeng, Zhan Yuanrui, et al. Combined Optimization Decision Tree Algorithm Suitable for Large Scale Data-base [J]. Systems Engineering and Electronics, 2009, 31(3): 583-587.)
[12] 赵静娴, 倪春鹏, 詹原瑞, 等. 一种高效的连续属性离散化算法[J]. 系统工程与电子技术, 2009, 31(1):195-199. (Zhao Jingxian, Ni Chunpeng, Zhan Yuanrui, et al. Efficient Discretization Algorithm for Continuous Attributes [J]. Systems Engineering and Electronics, 2009, 31(1): 195-199.)
[13] Ching J Y, Wong A K C, Chan K C C. Class-dependent Discretization for Inductive Learning from Continuous and Mixed-mode Data [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, 17(7): 641-651.

[1] 谢旺, 王丽珍, 陈红梅, 曾兰清. 基于空间序偶模式挖掘污染源与癌症病例的关系 *[J]. 数据分析与知识发现, 2021, 5(2): 14-31.
[2] 陈浩, 张梦毅, 程秀峰. 融合主题模型与决策树的跨地区专利合作关系发现与推荐*——以广东省和武汉市高校专利库为例[J]. 数据分析与知识发现, 2021, 5(10): 37-50.
[3] 张勇,李树青,程永上. 基于频次有效长度的加权关联规则挖掘算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 85-93.
[4] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[5] 牟冬梅,法慧,王萍,孙晶. 基于结构方程模型的疾病危险因素研究*[J]. 数据分析与知识发现, 2019, 3(4): 80-89.
[6] 程秀峰, 张心怡, 王宁. 基于CART决策树的网络问答社区新兴话题识别研究*[J]. 数据分析与知识发现, 2018, 2(12): 52-59.
[7] 范馨月, 崔雷. 基于网络属性的抗肿瘤药物靶点预测方法及其应用*[J]. 数据分析与知识发现, 2018, 2(12): 98-108.
[8] 李勇男. 贝叶斯理论在反恐情报分类分析中的应用研究*[J]. 数据分析与知识发现, 2018, 2(10): 9-14.
[9] 牟冬梅, 王萍, 赵丹宁. 高维电子病历的数据降维策略与实证研究*[J]. 数据分析与知识发现, 2018, 2(1): 88-98.
[10] 胡忠义, 王超群, 吴江. 融合多源网络评估数据及URL特征的钓鱼网站识别技术研究*[J]. 数据分析与知识发现, 2017, 1(6): 47-55.
[11] 江思伟, 谢振平, 陈梅婕, 蔡明. 混合特征数据的自解释归约建模方法*[J]. 数据分析与知识发现, 2017, 1(12): 92-100.
[12] 牟冬梅,任珂. 三种数据挖掘算法在电子病历知识发现中的比较*[J]. 现代图书情报技术, 2016, 32(6): 102-109.
[13] 李峰,李书宁,于静. 面向院系的高校毕业生图书馆记忆系统[J]. 现代图书情报技术, 2016, 32(5): 99-103.
[14] 杨旸,林辉,胡广伟. 面向光伏项目投资风险的大数据监测指标甄选研究*——以Solarbao平台为例[J]. 现代图书情报技术, 2016, 32(11): 11-19.
[15] 何建民, 王哲. 社交网络话题信息传播影响簇发现谱系挖掘方法[J]. 现代图书情报技术, 2015, 31(5): 65-72.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn