Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (8): 85-91     https://doi.org/10.11925/infotech.2096-3467.2017.08.10
  首届"数据分析与知识发现"学术研讨会专辑(II) 本期目录 | 过刊浏览 | 高级检索 |
基于HNC理论的文本情感倾向性分析*
高歌, 罗珺玫, 王宇()
大连理工大学管理与经济学部 大连 116024
Analyzing Textual Sentiment Based on HNC Theory
Gao Ge, Luo Junmei, Wang Yu()
Faculty of Management and Economics, Dalian University of Technology, Dalian 116024, China
全文: PDF (727 KB)   HTML ( 1
输出: BibTeX | EndNote (RIS)      
摘要 

目的】构建一种更加科学、准确的评论文本情感倾向性分析方法, 解决网络新词难于计算的问题。【方法】利用概念层次网络(HNC)理论的符号对偶性计算情感值, 根据建立的规则为新词确定符号, 利用符号重用降低工作量, 实现对新词的处理。【结果】通过对已有成果的分析和改进, 最终得到一套较为完善的情感倾向性分析方法, 并使用真实数据进行实验, 验证了该方法的可行性, 同时也发现了待改进之处。【局限】目前仅能对网络短文本进行分析, 且新词的加入需采用人工标注的方式。【结论】本文方法可行有效, 为文本情感分析提供了新思路。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
高歌
罗珺玫
王宇
关键词 评论文本情感分析概念层次网络(HNC)    
Abstract

[Objective] This sutdy proposes a new method to conduct sentiment analysis with comment texts, aiming to deal with the issues facing new online terms. [Methods] Based on the Hierarchical Network of Concepts (HNC) theory, we defined symbols for the new words, which could be processed more efficiently. [Results] The proposed method analyzed the sentiment of the textual message effectively. [Limitations] Our method could only process short texts, while we still need to manually create symbols for the new words. [Conclusions] We proposed an effective way to conduct sentiment analysis.

Key wordsComment Text    Sentiment Analysis    Hierarchical Network of Concepts (HNC)
收稿日期: 2017-05-27      出版日期: 2017-09-28
ZTFLH:  TP391  
基金资助:*本文系国家自然科学基金重点项目“社会化商务中参与者的信誉与信任机理及交易决策研究”(项目编号: 71431002)的研究成果之一
引用本文:   
高歌, 罗珺玫, 王宇. 基于HNC理论的文本情感倾向性分析*[J]. 数据分析与知识发现, 2017, 1(8): 85-91.
Gao Ge,Luo Junmei,Wang Yu. Analyzing Textual Sentiment Based on HNC Theory. Data Analysis and Knowledge Discovery, 2017, 1(8): 85-91.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.08.10      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I8/85
  基础情感值的确定
概念节点 HNC符号 权值
极、最 j60d01、j60c44 1.5
j60c43 1.3
稍微 j60c41 1.1
适度 j60c42、j60e41 1
不够 j60e42 0.8
过分 j60e43 -0.5
否定 ! -1
  程度副词及权值
  实验数据
情感词 基础
情感值
情感词 基础
情感值
情感词 基础
情感值
0 精细 1 热情 1
1 厉害 1 神速 1
不错 1 流畅 1 完美 1
0 -1 迅速 1
方便 1 耐心 1 正常 1
1 耐用 1 及时 1
合适 1 清晰 1 简陋 -1
划算 1 结实 1
  基础情感值
程度副词 有些 相当 特别 非常 比较
变动权值 1.1 1.3 1.3 1.3 1.5 1.3 1 1.3 1
  程度副词带来的变动
[1] 薛丽敏, 李殿伟, 肖斌. 中文文本情感倾向性五元模型研究[J]. 通信技术, 2011, 44(7): 130-132.
doi: 10.3969/j.issn.1002-0802.2011.07.047
[1] (Xue Limin, Li Dianwei, Xiao Bin.Study on Novel Quintuple Model for Chinese Text Sentiment Orientation[J]. Communications Technology, 2011, 44(7): 130-132.)
doi: 10.3969/j.issn.1002-0802.2011.07.047
[2] 朱嫣岚, 闵锦, 周雅倩, 等. 基于HowNet的词汇语义倾向计算[J]. 中文信息学报, 2006, 20(1): 14-20.
doi: 10.3969/j.issn.1003-0077.2006.01.003
[2] (Zhu Yanlan, Min Jin, Zhou Yaqian, et al.Semantic Orientation Computing Based on HowNet[J]. Journal of Chinese Information Processing, 2006, 20(1): 14-20.)
doi: 10.3969/j.issn.1003-0077.2006.01.003
[3] 聂卉, 容哲. 面向评论效用评估的文本情感特征提取[J]. 现代图书情报技术, 2015(7-8): 113-121.
[3] (Nie Hui, Rong Zhe.Review Helpfulness Prediction Research Based on Review Sentiment Feature Sets[J]. New Technology of Library and Information Service, 2015(7-8): 113-121.)
[4] 兰秋军, 刘文星, 李卫康, 等. 融合句法信息的金融论坛文本情感计算研究[J]. 现代图书情报技术, 2016(4): 64-71.
[4] (Lan Qiujun, Liu Wenxing, Li Weikang, et al.Sentiment Analysis of Financial Forum Textual Message[J]. New Technology of Library and Information Service, 2016(4): 64-71.)
[5] 何跃, 肖敏, 张月. 结合话题相关性的热点话题情感倾向研究[J]. 数据分析与知识发现, 2017, 1(3): 46-53.
[5] (He Yue, Xiao Min, Zhang Yue.Sentiment Analysis of Trending Topics Based on Relevance[J]. Data Analysis and Knowledge Discovery, 2017, 1(3): 46-53.)
[6] 钟义信. 自然语言理解的全信息方法论[J]. 北京邮电大学学报, 2004, 27(4): 1-12.
doi: 10.3969/j.issn.1007-5321.2004.04.001
[6] (Zhong Yixin.Comprehensive Information Based Methodology for Natural Language Understanding[J]. Journal of Beijing University of Posts and Telecommunications, 2004, 27(4): 1-12.)
doi: 10.3969/j.issn.1007-5321.2004.04.001
[7] 樊康新. 基于多种情感特征的网络文本倾向性判别方法研究[J]. 电脑知识与技术, 2015, 11(22): 18-21.
[7] (Fan Kangxin.Research on the Method of Network Text Orientation Discrimination Based on Multiple Sentiment Features[J]. Computer Knowledge and Technology, 2015, 11(22): 18-21.)
[8] 刘玮楠. 基于HNC理论的网购评论情感倾向性分析研究[D]. 大连: 大连理工大学, 2013.
[8] (Liu Weinan.Research on Sentiment Orientation Analysis of Online-shopping Review Base-on HNC Theory [D]. Dalian: Dalian University of Technology, 2013.)
[9] 黄曾阳. HNC理论概要[J]. 中文信息学报, 1997, 11(4): 12-21.
[9] (Huang Zengyang.The Profile of HNC Theory[J]. Journal of Chinese Information Processing, 1997, 11(4): 12-21.)
[10] 唐兴全. HNC理论的五元组与词性[C]//自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集. 2001.
[10] (Tang Xingquan.The Quintuple of HNC Theory and Part of Speech[C]//// Proceedings of the 6th Academic Conference on Computational Linguistics in China. 2001.)
[11] 李颖, 池毓焕. 对偶性概念的HNC阐释[J]. 中文信息学报, 2004, 18(3): 39-46.
doi: 10.3969/j.issn.1003-0077.2004.03.006
[11] (Li Ying, Chi Yuhuan.Re-Categorization of Antithesis Based on HNC Theory[J]. Journal of Chinese Information Processing, 2004, 18(3): 39-46.)
doi: 10.3969/j.issn.1003-0077.2004.03.006
[12] HNC(概念层次网络)理论[C]//中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编. 中国中文信息学会, 2006.
[12] (HNC (Hierarchical Network of Concepts) Theory[C]//// Proceedings of the 25th Anniversary Academic Conference of Chinese Information Society. 2006.)
[13] 王昌厚, 王菲. 使用基于模式的Bootstrapping方法抽取情感词[J]. 计算机工程与应用, 2014, 50(1): 127-129.
doi: 10.3778/j.issn.1002-8331.1203-0323
[13] (Wang Changhou, Wang Fei.Extracting Sentiment Words Using Pattern Based Bootstrapping Method[J]. Computer Engineering and Applications, 2014, 50(1): 127-129.)
doi: 10.3778/j.issn.1002-8331.1203-0323
[1] 钟佳娃,刘巍,王思丽,杨恒. 文本情感分析方法及应用综述*[J]. 数据分析与知识发现, 2021, 5(6): 1-13.
[2] 刘彤,刘琛,倪维健. 多层次数据增强的半监督中文情感分析方法*[J]. 数据分析与知识发现, 2021, 5(5): 51-58.
[3] 王雨竹,谢珺,陈波,续欣莹. 基于跨模态上下文感知注意力的多模态情感分析 *[J]. 数据分析与知识发现, 2021, 5(4): 49-59.
[4] 常城扬,王晓东,张胜磊. 基于深度学习方法对特定群体推特的动态政治情感极性分析*[J]. 数据分析与知识发现, 2021, 5(3): 121-131.
[5] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[6] 韩普, 张伟, 张展鹏, 王宇欣, 方浩宇. 基于特征融合和多通道的突发公共卫生事件微博情感分析*[J]. 数据分析与知识发现, 2021, 5(11): 68-79.
[7] 吕华揆,刘政昊,钱宇星,洪旭东. 异质性财经新闻与股市关系研究*[J]. 数据分析与知识发现, 2021, 5(1): 99-111.
[8] 徐红霞,于倩倩,钱力. 基于主题模型和情感分析的话题交互数据观点对抗性分析 *[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[9] 姜霖,张麒麟. 基于引文细粒度情感量化的学术评价研究*[J]. 数据分析与知识发现, 2020, 4(6): 129-138.
[10] 石磊,王毅,成颖,魏瑞斌. 自然语言处理中的注意力机制研究综述*[J]. 数据分析与知识发现, 2020, 4(5): 1-14.
[11] 李铁军,颜端武,杨雄飞. 基于情感加权关联规则的微博推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 27-33.
[12] 沈卓,李艳. 基于PreLM-FT细粒度情感分析的餐饮业用户评论挖掘[J]. 数据分析与知识发现, 2020, 4(4): 63-71.
[13] 薛福亮,刘丽芳. 一种基于CRF与ATAE-LSTM的细粒度情感分析方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[14] 张翼鹏,马敬东. 突发公共卫生事件误导信息受众情感分析及传播特征研究*[J]. 数据分析与知识发现, 2020, 4(12): 45-54.
[15] 谭荧,张进,夏立新. 社交媒体情境下的情感分析研究综述[J]. 数据分析与知识发现, 2020, 4(1): 1-11.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn