Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. Issue (11): 47-52     https://doi.org/10.11925/infotech.1003-3513.2012.11.08
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于层叠模型的国防领域命名实体识别研究
高强, 游宏梁
中国国防科技信息中心 北京 100142
Study on Named Entity Recognition Based on Cascaded Model for Field of Defense
Gao Qiang, You Hongliang
China Defense Science & Technology Information Center, Beijing 100142, China
全文: PDF (617 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 提出一种基于层叠模型的命名实体识别方法,将基于规则与基于统计的方法有机结合,可以克服单层模型的局限性,同时能够继承基于规则与基于统计方法各自的优点。在国防领域命名实体识别实验中,该方法对主要类型的命名实体的识别F值都在89%以上。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
高强
游宏梁
关键词 命名实体命名实体识别信息抽取层叠模型条件随机场    
Abstract:This paper first studies rule-based method and the statistic-based method of named entity,analyzes the strengths and weaknesses of the two methods.Then it presents a cascaded model for named entity recognition, which combines of the rule-based method and the statistic-based method.In the named entity recoginzation experiment for field of defense,the F value is more than 89%.
Key wordsNamed entity    Named entity recognition    Information extraction    Cascaded model    Conditional random fields
收稿日期: 2012-10-14      出版日期: 2013-02-06
:  TP391  
通讯作者: 高强     E-mail: gqcloud@yahoo.cn
引用本文:   
高强, 游宏梁. 基于层叠模型的国防领域命名实体识别研究[J]. 现代图书情报技术, 2012, (11): 47-52.
Gao Qiang, You Hongliang. Study on Named Entity Recognition Based on Cascaded Model for Field of Defense. New Technology of Library and Information Service, 2012, (11): 47-52.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.11.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2012/V/I11/47
[1] Roman Y, Ralph G. NYU: Description of the Proteus/PET System as Used for MUC-7 ST[C]. In: Proceedings of the 7th Message Understanding Conference (MUC-7), Fairfax, Virginia.1998.
[2] Fukumoto J, Shimohata M, Masui F. OKI Electric Industry: Description of the OKI System as Used for MET-2[C]. In: Proceedings of the 7th Message Understanding Conference (MUC-7), Fairfax, Virginia.1998.
[3] General Architecture for Text Engineering[EB/OL].[2012-07-15].http://gate.ac.uk/.
[4] Adam B, Stephen A. A Maximum Entropy Approach to Natural Language Processing[J]. Computational Linguistics,1996,22(1):39-71.
[5] Rabiner L R, Juang B H. An Introduction to Hidden Markov Models[J]. IEEE ASSP Magazine, 1986, 3(1):4-16.
[6] 赵晓凡,赵丹,刘永革. 利用CRF实现中文人名性别的自动识别[J]. 微电子学与计算机, 2011,28(10):122-128. (Zhao Xiaofan,Zhao Dan,Liu Yongge. The Automatic Gender Recognition of Chinese Name Using Conditional Random Fields[J]. Microelectronics & Computer, 2011,28(10):122-128.)
[7] Chieu H L,Teow L N. Combining Local and Non-Local Information with Dual Decomposition for Named Entity Recognition from Text[C]. In: Proceedings of the 15th International Conference on Information Fusion (FUSION), Singapore. 2012:231-238.
[8] Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]. In: Proceedings of the 18th International Conference on Machine Learning. 2001:282-289.
[9] Developing Language Processing Components with GATE Version 7 (a User Guide)[EB/OL].[2012-07-15].http://gate.ac.uk/sale/tao/split.html.
[10] 王昊. 基于层次模式匹配的命名实体识别模型[J]. 现代图书情报技术,2007 (5):62-68. (Wang Hao. Named Entity Extraction Model Based on Hierarchical Pattern Matching[J]. New Technology of Library and Information Service, 2007 (5):62-68.)
[11] 万如.中文机构名的识别研究[D]. 大连:大连理工大学,2008.(Wan Ru.The Research of Chinese Organization Name Recogintion[D]. DaLian:Dalian University of Technology,2008.)
[1] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[2] 王昊, 林克柔, 孟镇, 李心蕾. 文本表示及其特征生成对法律判决书中多类型实体识别的影响分析[J]. 数据分析与知识发现, 2021, 5(7): 10-25.
[3] 成彬,施水才,都云程,肖诗斌. 基于融合词性的BiLSTM-CRF的期刊关键词抽取方法[J]. 数据分析与知识发现, 2021, 5(3): 101-108.
[4] 温萍梅,叶志炜,丁文健,刘颖,徐健. 命名实体消歧研究进展综述*[J]. 数据分析与知识发现, 2020, 4(9): 15-25.
[5] 徐晨飞, 叶海影, 包平. 基于深度学习的方志物产资料实体自动识别模型构建研究*[J]. 数据分析与知识发现, 2020, 4(8): 86-97.
[6] 赵平,孙连英,涂帅,卞建玲,万莹. 改进的知识迁移景点实体识别算法研究及应用*[J]. 数据分析与知识发现, 2020, 4(5): 118-126.
[7] 李成梁,赵中英,李超,亓亮,温彦. 基于依存关系嵌入与条件随机场的商品属性抽取方法*[J]. 数据分析与知识发现, 2020, 4(5): 54-65.
[8] 高原,施元磊,张蕾,曹天奕,冯筠. 基于游记文本的游客游览行程重构*[J]. 数据分析与知识发现, 2020, 4(2/3): 165-172.
[9] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
[10] 刘婧茹,宋阳,贾睿,张翼鹏,罗勇,马敬东. 基于BiLSTM-CRF中文临床文本中受保护的健康信息识别*[J]. 数据分析与知识发现, 2020, 4(10): 124-133.
[11] 陶玥,余丽,张润杰. 科技文献中短语级主题抽取的主动学习方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 134-143.
[12] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[13] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[14] 袁悦,王东波,黄水清,李斌. 不同词性标记集在典籍实体抽取上的差异性探究*[J]. 数据分析与知识发现, 2019, 3(3): 57-65.
[15] 陈美杉,夏晨曦. 肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法 *[J]. 数据分析与知识发现, 2019, 3(12): 61-69.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn