%A 丁晟春,俞沣洋,李真 %T 网络舆情潜在热点主题识别研究* %0 Journal Article %D 2020 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2019.0735 %P 29-38 %V 4 %N 2/3 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4791.shtml} %8 2020-02-25 %X

【目的】 从网络舆情数据流中获取潜在热点主题,帮助政府与企业进行重点舆情监测与正确舆论引导。【方法】 对微博实时数据流进行增量式舆情主题检测,选取并量化能够区分主题热门与非热门的特征项,选择逻辑回归(Logistic Regression)与支持向量机(SVM)两种机器学习模型作为潜在热点主题预测的候选模型,通过模型训练与效果对比确定最佳的潜在热点主题识别模型。【结果】 Logistic Regression相比SVM更适合作为潜在热点主题识别模型,其召回率为0.89。【局限】 方法缺少在多样化社交媒体平台的应用。【结论】 本研究构建的模型能有效识别网络舆情潜在热点主题,为政府与企业的舆情监测与舆论引导提供帮助。