Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (6): 42-47     https://doi.org/10.11925/infotech.1003-3513.2010.06.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
命名实体识别研究进展综述
孙镇1,3,王惠临2
1(北京大学信息管理系北京 100871)
2(中国科学技术信息研究所北京 100038)
3(全国组织机构代码管理中心北京 100029)
Overview on the Advance of the Research on Named Entity Recognition
Sun Zhen1,3  Wang Huilin2
1(Department of Information Management, Peking University,Beijing 100871,China)
2(Institute of Scientific & Technical Information of China,Beijing 100038,China)
3(National Administration for Code Allocation to Organizations, Beijing 100029,China)
全文: PDF (393 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

介绍命名实体识别的研究背景和意义,总结国内外命名实体识别研究历史,详细介绍目前主流的技术方法和评估方法,讨论命名实体识别技术的发展趋势。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
孙镇
王惠临
关键词 命名实体识别信息抽取信息检索机器翻译评估方法    
Abstract

 The paper introduces the background and motivation of Named Entity Recognition,and summarizes the history development of Named Entity Recognition at home and abroad, as well as the related technology and evaluation method. Finally,it discusses the new development trends on Named Entity Recognition.

Key words Named entity recognition    Information extraction    Information retrieval    Machine translation    Evaluation methods
收稿日期: 2010-03-24      出版日期: 2010-07-26
: 

 

 
  TP391

 
通讯作者: 孙镇     E-mail: sunzhenyh@yahoo.com.cn
引用本文:   
孙镇 王惠临. 命名实体识别研究进展综述[J]. 现代图书情报技术, 2010, 26(6): 42-47.
Sun Zhen Wang Huilin. Overview on the Advance of the Research on Named Entity Recognition. New Technology of Library and Information Service, 2010, 26(6): 42-47.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.06.07      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I6/42

[1] Chinchor N. MUC-7 Named Entity Task Definition[C]. In:Proceedings of the 7th Message Understanding Conference,Virginia. 1998.
[2] Sproat R,Emerson T. The First International Chinese Word Segmentation Bakeoff[C].In:Proceedings of the 2nd SIGHAN Workshop on Chinese Language Processing,Sapporo,Japan. 2003:133-143.
[3] Rau L F. Extracting Company Names from Text[C].In:Proceedings of the 7th IEEE Conference on Artificial Intelligence Applications.1991:29-32.
[4] Grishman R, Sundheim B. Message Understanding Conference-6:A Brief History[C]. In:Proceedings of the 16th International Conference on Computational Linguistics. 1996.
[5] Chinchor N A.Overview of MUC-7/MET-2[C]. In:Proceedings of the 7th Message Understanding Conference.1998.
[6] 孙茂松,黄昌宁,高海燕,等.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27.
[7] 张小衡,王玲玲.中文机构名称的识别与分析[J]. 中文信息学报,1997, 11(4):21-32.
[8] Zhang Y, Zhou J F. A Trainable Method for Extracting Chinese Entity Names and Their Relations[C]. In: Proceedings of the 2nd Chinese Language Processing Workshop,HongKong.2000:66-76.
[9] Bikel D M,Schwarta R, Weischedel R M.An Algorithm that Learns What’s in a Name[J].Machine Learning Journal Special Issue on Natural Language Learning,1999,34(1-3):211-231.
[10] Liao W,Veeramachaneni S. A Simple Semi-supervised Algorithm for Named Entity Recognition[C].In:Proceedings of the NAACL HLT 2009 Workshop on Semi-supervised Learning for Natural Language Processing.2009:58-65.
[11] Ratinov L, Roth D.Design Challenges and Misconceptions in Named Entity Recognition[C]. In:Proceedings of the 13th Conference on Computational Natural Language Learning.2009:147–155.
[12] Tsai T, Wu S, Lee C,et al. Mencius:A Chinese Named Entity Recognizer Using the Maximum Entropy-based Hybrid Model[J].International Journal of Computational Linguistics & Chinese Language Processing,2004,9(1):65-81.
[13] 冯元勇,孙乐,李文波,等.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):105-110.
[14] 郑逢强, 林磊,刘秉权,等.《知网》在命名实体识别中的应用研究[J].中文信息学报,2008,22(5):97-101.
[15] 刘非凡,赵军,吕碧波,等.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13.
[16] 薛征山,郭剑毅,余正涛,等.基于HMM的中文旅游景点的识别[J].昆明理工大学学报:理工版,2009,34(6):44-48.
[17] 邱莎.基于统计的生物命名实体识别研究[D].成都:四川大学,2006.
[18] 徐薇,付滨,刘柳,等.中文命名实体识别系统的领域扩展[C].见:第9届全国计算语言学学术会议论文集. 2007.
[19] Poibeau T.The Multilingual Named Entity Recognition Framework[C].In:Proceedings of the 10th Conference on European Chapter of the Association for Computational Linguistics.2003:155-158.
[20] Sang T K. Introduction to the CoNLL-2002 Shared Task:Language-Independent Named Entity Recognition[C].In:Proceedings of the 6th Conference on Natural Language Learning, Taipei,Taiwan. Morristown, NJ, USA:Association for Computational Linguistics,2002:1-4.
[21] Sang T K,Meulder F D.Introduction to the CoNLL-2003 Shared Task:Language-Independent Named Entity Recognition[C]. In:Proceedings of the 7th Conference on Natural Language Learning at HLT-NAACL, Edmonton,Canada. Morristown, NJ, USA:Association for Computational Linguistics,2003:142-147.
[22] 王宁,葛瑞芳,苑春法,等.中文金融新闻中公司名的识别[J].中文信息学报,2002,16(2):1-6.
[23] 王丹,樊兴华. 面向短文本的命名实体识别[J].计算机应用, 2009,29(1):143-145.
[24] 张祝玉,任飞亮,朱靖波.基于条件随机场的中文命名实体识别特征比较研究[C].见:第4届全国信息检索与内容安全学术会议论文集.2008.
[25] 第一届中国中文信息学会汉语处理评测(CIPS-CLPE)暨第四届国际中文自然语言处理Bakeoff[EB/OL].[2010-01-11].http://www.china-language.gov.cn/bakeoff08/.
[26] Kazama J, Torisawa K.Exploiting Wikipedia as External Knowledge for Named Entity Recognition[C].In:Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning.2007:698-707.
[27] Cucerzan S. Large-Scale Named Entity Disambiguation Based on Wikipedia Data[C]. In:Proceedings of Empirical Methods in Natural Language Processing, Prague,Czech Republic.2007:708–716.
[28] 俞鸿魁,张华平,刘群,等.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-93.
[29] Lin Y, Tsai T, Chou W, et al. A Maximum Entropy Approach to Biomedical Named Entity Recognition[C].In:Proceedings of the 4th ACM SIGKDD Workshop on Data Mining in Bioinformatics.2004.
[30] Automatic Content Extraction 2008 Evaluation Plan(ACE08)[EB/OL].(2008-05-30).[2010-01-11]. http://nist.gov/speech/tests/ace/2008/doc/ace08-evalplan.v1.2d.pdf.

[1] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[2] 刘文斌, 何彦青, 吴振峰, 董诚. 基于BERT和多相似度融合的句子对齐方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 48-58.
[3] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[4] 孟镇,王昊,虞为,邓三鸿,张宝隆. 基于特征融合的声乐分类研究*[J]. 数据分析与知识发现, 2021, 5(5): 59-70.
[5] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[6] 徐晨飞, 叶海影, 包平. 基于深度学习的方志物产资料实体自动识别模型构建研究*[J]. 数据分析与知识发现, 2020, 4(8): 86-97.
[7] 石磊,王毅,成颖,魏瑞斌. 自然语言处理中的注意力机制研究综述*[J]. 数据分析与知识发现, 2020, 4(5): 1-14.
[8] 高原,施元磊,张蕾,曹天奕,冯筠. 基于游记文本的游客游览行程重构*[J]. 数据分析与知识发现, 2020, 4(2/3): 165-172.
[9] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
[10] 刘婧茹,宋阳,贾睿,张翼鹏,罗勇,马敬东. 基于BiLSTM-CRF中文临床文本中受保护的健康信息识别*[J]. 数据分析与知识发现, 2020, 4(10): 124-133.
[11] 陶玥,余丽,张润杰. 科技文献中短语级主题抽取的主动学习方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 134-143.
[12] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[13] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[14] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[15] 刘清民,姚长青,石崇德,温晓洁,孙玥莹. 面向科技文献神经机器翻译词汇表优化研究*[J]. 数据分析与知识发现, 2019, 3(3): 76-82.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn