Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. Issue (11): 47-52    DOI: 10.11925/infotech.1003-3513.2012.11.08
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于层叠模型的国防领域命名实体识别研究
高强, 游宏梁
中国国防科技信息中心 北京 100142
Study on Named Entity Recognition Based on Cascaded Model for Field of Defense
Gao Qiang, You Hongliang
China Defense Science & Technology Information Center, Beijing 100142, China
全文: PDF(617 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 提出一种基于层叠模型的命名实体识别方法,将基于规则与基于统计的方法有机结合,可以克服单层模型的局限性,同时能够继承基于规则与基于统计方法各自的优点。在国防领域命名实体识别实验中,该方法对主要类型的命名实体的识别F值都在89%以上。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
高强
游宏梁
关键词 命名实体命名实体识别信息抽取层叠模型条件随机场    
Abstract:This paper first studies rule-based method and the statistic-based method of named entity,analyzes the strengths and weaknesses of the two methods.Then it presents a cascaded model for named entity recognition, which combines of the rule-based method and the statistic-based method.In the named entity recoginzation experiment for field of defense,the F value is more than 89%.
Key wordsNamed entity    Named entity recognition    Information extraction    Cascaded model    Conditional random fields
收稿日期: 2012-10-14     
:  TP391  
通讯作者: 高强     E-mail: gqcloud@yahoo.cn
引用本文:   
高强, 游宏梁. 基于层叠模型的国防领域命名实体识别研究[J]. 现代图书情报技术, 2012, (11): 47-52.
Gao Qiang, You Hongliang. Study on Named Entity Recognition Based on Cascaded Model for Field of Defense. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2012.11.08.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.11.08
[1] Roman Y, Ralph G. NYU: Description of the Proteus/PET System as Used for MUC-7 ST[C]. In: Proceedings of the 7th Message Understanding Conference (MUC-7), Fairfax, Virginia.1998.
[2] Fukumoto J, Shimohata M, Masui F. OKI Electric Industry: Description of the OKI System as Used for MET-2[C]. In: Proceedings of the 7th Message Understanding Conference (MUC-7), Fairfax, Virginia.1998.
[3] General Architecture for Text Engineering[EB/OL].[2012-07-15].http://gate.ac.uk/.
[4] Adam B, Stephen A. A Maximum Entropy Approach to Natural Language Processing[J]. Computational Linguistics,1996,22(1):39-71.
[5] Rabiner L R, Juang B H. An Introduction to Hidden Markov Models[J]. IEEE ASSP Magazine, 1986, 3(1):4-16.
[6] 赵晓凡,赵丹,刘永革. 利用CRF实现中文人名性别的自动识别[J]. 微电子学与计算机, 2011,28(10):122-128. (Zhao Xiaofan,Zhao Dan,Liu Yongge. The Automatic Gender Recognition of Chinese Name Using Conditional Random Fields[J]. Microelectronics & Computer, 2011,28(10):122-128.)
[7] Chieu H L,Teow L N. Combining Local and Non-Local Information with Dual Decomposition for Named Entity Recognition from Text[C]. In: Proceedings of the 15th International Conference on Information Fusion (FUSION), Singapore. 2012:231-238.
[8] Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]. In: Proceedings of the 18th International Conference on Machine Learning. 2001:282-289.
[9] Developing Language Processing Components with GATE Version 7 (a User Guide)[EB/OL].[2012-07-15].http://gate.ac.uk/sale/tao/split.html.
[10] 王昊. 基于层次模式匹配的命名实体识别模型[J]. 现代图书情报技术,2007 (5):62-68. (Wang Hao. Named Entity Extraction Model Based on Hierarchical Pattern Matching[J]. New Technology of Library and Information Service, 2007 (5):62-68.)
[11] 万如.中文机构名的识别研究[D]. 大连:大连理工大学,2008.(Wan Ru.The Research of Chinese Organization Name Recogintion[D]. DaLian:Dalian University of Technology,2008.)
[1] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[2] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[3] 袁悦,王东波,黄水清,李斌. 不同词性标记集在典籍实体抽取上的差异性探究*[J]. 数据分析与知识发现, 2019, 3(3): 57-65.
[4] 余丽,钱力,付常雷,赵华茗. 基于深度学习的文本中细粒度知识元抽取方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 38-45.
[5] 牟冬梅,金姗,琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[6] 唐慧慧,王昊,张紫玄,王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[7] 范馨月,崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
[8] 王东波,吴毅,叶文豪,刘睿伦. 多特征知识下的食品安全事件实体抽取研究*[J]. 数据分析与知识发现, 2017, 1(3): 54-61.
[9] 张越,王东波,朱丹浩. 面向食品安全突发事件汉语分词的特征选择及模型优化研究*[J]. 数据分析与知识发现, 2017, 1(2): 64-72.
[10] 张琳,秦策,叶文豪. 基于条件随机场的法言法语实体自动识别模型研究*[J]. 数据分析与知识发现, 2017, 1(11): 46-52.
[11] 王密平,王昊,邓三鸿,吴志祥. 基于CRFs的冶金领域中文专利术语抽取研究*[J]. 现代图书情报技术, 2016, 32(6): 28-36.
[12] 贺惠新,刘丽娟. 主动学习的科技文献研究对象标引体系研究*[J]. 现代图书情报技术, 2016, 32(3): 67-73.
[13] 隋明爽,崔雷. 结合多种特征的CRF模型用于化学物质-疾病命名实体识别[J]. 现代图书情报技术, 2016, 32(10): 91-97.
[14] 段宇锋,黄思思. 中文植物物种多样性描述文本的信息抽取研究*[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[15] 任育伟, 吕学强, 李卓, 徐丽萍. 搜索日志中命名实体识别[J]. 现代图书情报技术, 2015, 31(6): 49-56.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn