Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (6): 42-47    DOI: 10.11925/infotech.1003-3513.2010.06.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
命名实体识别研究进展综述
孙镇1,3,王惠临2
1(北京大学信息管理系北京 100871)
2(中国科学技术信息研究所北京 100038)
3(全国组织机构代码管理中心北京 100029)
Overview on the Advance of the Research on Named Entity Recognition
Sun Zhen1,3  Wang Huilin2
1(Department of Information Management, Peking University,Beijing 100871,China)
2(Institute of Scientific & Technical Information of China,Beijing 100038,China)
3(National Administration for Code Allocation to Organizations, Beijing 100029,China)
全文: PDF(393 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

介绍命名实体识别的研究背景和意义,总结国内外命名实体识别研究历史,详细介绍目前主流的技术方法和评估方法,讨论命名实体识别技术的发展趋势。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
孙镇
王惠临
关键词 命名实体识别信息抽取信息检索机器翻译评估方法    
Abstract

 The paper introduces the background and motivation of Named Entity Recognition,and summarizes the history development of Named Entity Recognition at home and abroad, as well as the related technology and evaluation method. Finally,it discusses the new development trends on Named Entity Recognition.

Key words Named entity recognition    Information extraction    Information retrieval    Machine translation    Evaluation methods
收稿日期: 2010-03-24     
: 

 

 
  TP391

 
通讯作者: 孙镇     E-mail: sunzhenyh@yahoo.com.cn
引用本文:   
孙镇 王惠临. 命名实体识别研究进展综述[J]. 现代图书情报技术, 2010, 26(6): 42-47.
Sun Zhen Wang Huilin. Overview on the Advance of the Research on Named Entity Recognition. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2010.06.07.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.06.07

[1] Chinchor N. MUC-7 Named Entity Task Definition[C]. In:Proceedings of the 7th Message Understanding Conference,Virginia. 1998.
[2] Sproat R,Emerson T. The First International Chinese Word Segmentation Bakeoff[C].In:Proceedings of the 2nd SIGHAN Workshop on Chinese Language Processing,Sapporo,Japan. 2003:133-143.
[3] Rau L F. Extracting Company Names from Text[C].In:Proceedings of the 7th IEEE Conference on Artificial Intelligence Applications.1991:29-32.
[4] Grishman R, Sundheim B. Message Understanding Conference-6:A Brief History[C]. In:Proceedings of the 16th International Conference on Computational Linguistics. 1996.
[5] Chinchor N A.Overview of MUC-7/MET-2[C]. In:Proceedings of the 7th Message Understanding Conference.1998.
[6] 孙茂松,黄昌宁,高海燕,等.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27.
[7] 张小衡,王玲玲.中文机构名称的识别与分析[J]. 中文信息学报,1997, 11(4):21-32.
[8] Zhang Y, Zhou J F. A Trainable Method for Extracting Chinese Entity Names and Their Relations[C]. In: Proceedings of the 2nd Chinese Language Processing Workshop,HongKong.2000:66-76.
[9] Bikel D M,Schwarta R, Weischedel R M.An Algorithm that Learns What’s in a Name[J].Machine Learning Journal Special Issue on Natural Language Learning,1999,34(1-3):211-231.
[10] Liao W,Veeramachaneni S. A Simple Semi-supervised Algorithm for Named Entity Recognition[C].In:Proceedings of the NAACL HLT 2009 Workshop on Semi-supervised Learning for Natural Language Processing.2009:58-65.
[11] Ratinov L, Roth D.Design Challenges and Misconceptions in Named Entity Recognition[C]. In:Proceedings of the 13th Conference on Computational Natural Language Learning.2009:147–155.
[12] Tsai T, Wu S, Lee C,et al. Mencius:A Chinese Named Entity Recognizer Using the Maximum Entropy-based Hybrid Model[J].International Journal of Computational Linguistics & Chinese Language Processing,2004,9(1):65-81.
[13] 冯元勇,孙乐,李文波,等.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):105-110.
[14] 郑逢强, 林磊,刘秉权,等.《知网》在命名实体识别中的应用研究[J].中文信息学报,2008,22(5):97-101.
[15] 刘非凡,赵军,吕碧波,等.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13.
[16] 薛征山,郭剑毅,余正涛,等.基于HMM的中文旅游景点的识别[J].昆明理工大学学报:理工版,2009,34(6):44-48.
[17] 邱莎.基于统计的生物命名实体识别研究[D].成都:四川大学,2006.
[18] 徐薇,付滨,刘柳,等.中文命名实体识别系统的领域扩展[C].见:第9届全国计算语言学学术会议论文集. 2007.
[19] Poibeau T.The Multilingual Named Entity Recognition Framework[C].In:Proceedings of the 10th Conference on European Chapter of the Association for Computational Linguistics.2003:155-158.
[20] Sang T K. Introduction to the CoNLL-2002 Shared Task:Language-Independent Named Entity Recognition[C].In:Proceedings of the 6th Conference on Natural Language Learning, Taipei,Taiwan. Morristown, NJ, USA:Association for Computational Linguistics,2002:1-4.
[21] Sang T K,Meulder F D.Introduction to the CoNLL-2003 Shared Task:Language-Independent Named Entity Recognition[C]. In:Proceedings of the 7th Conference on Natural Language Learning at HLT-NAACL, Edmonton,Canada. Morristown, NJ, USA:Association for Computational Linguistics,2003:142-147.
[22] 王宁,葛瑞芳,苑春法,等.中文金融新闻中公司名的识别[J].中文信息学报,2002,16(2):1-6.
[23] 王丹,樊兴华. 面向短文本的命名实体识别[J].计算机应用, 2009,29(1):143-145.
[24] 张祝玉,任飞亮,朱靖波.基于条件随机场的中文命名实体识别特征比较研究[C].见:第4届全国信息检索与内容安全学术会议论文集.2008.
[25] 第一届中国中文信息学会汉语处理评测(CIPS-CLPE)暨第四届国际中文自然语言处理Bakeoff[EB/OL].[2010-01-11].http://www.china-language.gov.cn/bakeoff08/.
[26] Kazama J, Torisawa K.Exploiting Wikipedia as External Knowledge for Named Entity Recognition[C].In:Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning.2007:698-707.
[27] Cucerzan S. Large-Scale Named Entity Disambiguation Based on Wikipedia Data[C]. In:Proceedings of Empirical Methods in Natural Language Processing, Prague,Czech Republic.2007:708–716.
[28] 俞鸿魁,张华平,刘群,等.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-93.
[29] Lin Y, Tsai T, Chou W, et al. A Maximum Entropy Approach to Biomedical Named Entity Recognition[C].In:Proceedings of the 4th ACM SIGKDD Workshop on Data Mining in Bioinformatics.2004.
[30] Automatic Content Extraction 2008 Evaluation Plan(ACE08)[EB/OL].(2008-05-30).[2010-01-11]. http://nist.gov/speech/tests/ace/2008/doc/ace08-evalplan.v1.2d.pdf.

[1] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[2] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[3] 刘清民,姚长青,石崇德,温晓洁,孙玥莹. 面向科技文献神经机器翻译词汇表优化研究*[J]. 数据分析与知识发现, 2019, 3(3): 76-82.
[4] 余丽,钱力,付常雷,赵华茗. 基于深度学习的文本中细粒度知识元抽取方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 38-45.
[5] 孙海霞,王蕾,吴英杰,华薇娜,李军莲. 科技文献数据库中机构名称匹配策略研究*[J]. 数据分析与知识发现, 2018, 2(8): 88-97.
[6] 牟冬梅,金姗,琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[7] 唐慧慧,王昊,张紫玄,王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[8] 范馨月,崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
[9] 杨超凡,邓仲华,彭鑫,刘斌. 近5年信息检索的研究热点与发展趋势综述*——基于相关会议论文的分析[J]. 数据分析与知识发现, 2017, 1(7): 35-43.
[10] 张晓娟, 韩毅. 时态信息检索研究综述*[J]. 数据分析与知识发现, 2017, 1(1): 3-15.
[11] 黄名选. 基于矩阵加权关联模式的印尼中跨语言信息检索模型*[J]. 数据分析与知识发现, 2017, 1(1): 26-36.
[12] 隋明爽,崔雷. 结合多种特征的CRF模型用于化学物质-疾病命名实体识别[J]. 现代图书情报技术, 2016, 32(10): 91-97.
[13] 丁恒, 陆伟. 基于相关性的跨模态信息检索研究*[J]. 现代图书情报技术, 2016, 32(1): 17-23.
[14] 段宇锋,黄思思. 中文植物物种多样性描述文本的信息抽取研究*[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[15] 刘伟, 王星, 宋培彦. 同义词抽取结果的噪音清洗方法研究[J]. 现代图书情报技术, 2015, 31(6): 64-70.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn