Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (3): 17-21     https://doi.org/10.11925/infotech.1003-3513.2011.03.03
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
基于CRFs自动构建维吾尔语情感词语料库
冯冠军1, 禹龙2, 田生伟3
1. 新疆大学人文学院 乌鲁木齐 830046;
2. 新疆大学网络中心 乌鲁木齐 830046;
3. 新疆大学信息科学与工程学院 乌鲁木齐 830046
Auto Construction of Uyghur Emotional Words Corpus Based on CRFs
Feng Guanjun1, Yu Long2, Tian Shengwei3
1. College of Humanities, Xinjiang University, Urumqi 830046, China;
2. Net Center, Xinjiang University, Urumqi 830046,China;
3. College of Information Science and Engineering Technology, Xinjiang University, Urumqi 830046,China
全文: PDF (602 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分析维吾尔语情感词汇的特征,利用条件随机场(CRFs)模型进行维吾尔语情感词汇的自动识别。测试结果验证该系统能够大幅度降低人工劳动,高效快速地标注维吾尔语情感词语料。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
冯冠军
禹龙
田生伟
关键词 维吾尔语情感语料语料库构建    
Abstract:This paper proposes uyghur emotional corpus construction specifications and develops uyghur emotional corpus processing system.Combined with the specific characteristics of uyghur emotional words,this paper proposes the full analysis of characteristics of uyghur emotional words in the text,achieves the uyghur emotional words automatic identification method with CRFs model.Experimental results show that the system can effectively process emotional words corpus, and reduce the manual workload.
Key wordsUyghur    Emotional corpus    Corpus construction
收稿日期: 2010-12-22      出版日期: 2011-05-05
: 

TP391

 
基金资助:

本文系国家社会科学基金项目“维吾尔语网络舆情监测与分析方法研究”(项目编号:10BTQ045)、国家自然科学基金项目“维吾尔语文本情感倾向性分析技术研究”(项目编号:60963017)和新疆大学博士基金“维吾尔语情感语料库构建技术研究”(项目编号:BS100120)的研究成果之一。

引用本文:   
冯冠军, 禹龙, 田生伟. 基于CRFs自动构建维吾尔语情感词语料库[J]. 现代图书情报技术, 2011, 27(3): 17-21.
Feng Guanjun, Yu Long, Tian Shengwei. Auto Construction of Uyghur Emotional Words Corpus Based on CRFs. New Technology of Library and Information Service, 2011, 27(3): 17-21.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.03.03      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I3/17
[1] Bai X, Padman R, Airoldi E. Sentiment Extraction from Unstructured Text Using Tabu Search-Enhanced Markov Blanket [C].In: Proceedings of the International Workshop on Mining for and from the Semantic Web (MSW 2004).2004:24-35

[2] Pang B, Lee L. Exploiting Class Relationships for Sentiment Categorization with Respect Rating Sales[C]. In: Proceedings of ACL-05. 2005: 115-124.

[3] 王洪伟,刘勰,尹裴,等. Web文本情感分类研究综述[J]. 情报学报,2010,29(5):931-938.

[4] 苏劲松,周昌乐,李翼鸿.基于统计抽词和格律的全宋词切分语料库建立[J].中文信息学报,2007,21(2):52-57.

[5] 徐琳宏,林鸿飞,赵晶. 情感语料库的构建和分析[J]. 中文信息学报,2008,22(1):116-122.

[6] 李纲,陈婧,程明结, 等.基于意见挖掘的城市形象网络监测系统初探[J].现代图书情报技术, 2010(2):56-62.

[7] 钱爱兵.基于主题的网络舆情分析模型及其实现[J].现代图书情报技术, 2008(4):49-55.

[8] Aone C, Ramos-Santacruz M, Niehaus W J. Assentor: An NLP-Based Solution to E-mail Monitoring[C]. In:Proceedings of AAAI-00.2000: 945-950.

[9] Ekman P.Facial Expression and Emotion[J].American Psychologist,1993,48(4):384-392.

[10] 林传鼎.社会主义心理学中的情绪问题——在中国社会心理学研究会成立大会上的报告(摘要)[J].社会心理科学,2006,21(1):37-37,62.

[11] 许小颖,陶建华.汉语情感系统中情感划分的研究[C].见:第一届中国情感计算及智能交互学术会议,北京.2003:199-205.

[12] Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]. In: Proceedings of the 18th International Conference on Machine Learning.2001:282-289.
[1] 康小丽, 章成志. 用于双语术语抽取的专业领域中英文可比语料库构建[J]. 现代图书情报技术, 2012, 28(2): 28-33.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn