Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (2): 73-79     https://doi.org/10.11925/infotech.2096-3467.2017.02.10
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于SVM多特征融合的微博情感多级分类研究*
杨爽(), 陈芬
南京理工大学经济管理学院 南京 210094
Analyzing Sentiments of Micro-blog Posts Based on Support Vector Machine
Yang Shuang(), Chen Fen
School of Economics and Management, Nanjing University of Science & Technology, Nanjing 210094, China
全文: PDF (466 KB)   HTML ( 27
输出: BibTeX | EndNote (RIS)      
摘要 

目的】为更精确地识别网民态度, 监测网络舆情, 提出一种基于SVM多特征融合的情感5级分类方法。【方法】从词性特征、情感特征、句式特征、语义特征4个方面, 提取动词、名词、情感词、否定词等14个特征, 运用SVM方法对微博情感进行5级分类。【结果】实验结果表明, 该方法对情感5级分类的准确率为82.40%, 召回率为81.91%, F值为82.10%。【局限】训练语料的规模有待进一步提高。【结论】该方法在情感5级分类方面取得较好的效果。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
杨爽
陈芬
关键词 微博情感倾向性支持向量机句法分析    
Abstract

[Objective] This paper proposes a new method based on the Support Vector Machine to monitor online public opinion. [Methods] We extracted fourteen linguistic characteristics of the micro-blog posts and analysed their sentiments with Support Vector Machine. [Results] The precision, recall and F value of the proposed method were 82.40%, 81.91%, and 82.10%, respectively. [Limitations] The size of training corpus needs to be expanded. [Conclusions] The proposed method could effectively analyze sentiments of micro-blog posts.

Key wordsMicroblog    Sentiment Analysis    Support Vector Machine    Parsing
收稿日期: 2016-08-29      出版日期: 2017-03-27
ZTFLH:  G35 TP391  
基金资助:*本文系国家自然科学基金项目“基于情感倾向性分析的网络舆情意见领袖识别与对策研究”(项目编号: 71303111)、国家自然科学基金项目“突发事件网络舆情演变过程中的人群仿真研究”(项目编号: 71273132)和国家自然科学基金项目“基于聚合的社会化短文本信息处理与细粒度倾向性分析”(项目编号: 71503126)的研究成果之一
引用本文:   
杨爽