Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (5): 13-17    DOI: 10.11925/infotech.1003-3513.2010.05.03
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
基于启发式规则的中文化学物质命名识别研究
李楠,郑荣廷,吉久明,滕青青
(华东理工大学图书馆上海 200237)
Research on Chinese Chemical Name Recognition Based on Heuristic Rules
Li Nan Zheng Rongting Ji JiumingTeng Qingqing
(Library of East China University of Science and Technology, Shanghai 200237, China)
全文: PDF(437 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对现有的命名实体识别方法不能很好地处理专业领域特定命名抽取的问题,提出一种基于启发式规则的专业命名识别方法。以中文文本中化学物质命名为研究对象,分析其领域特征及统计语言特征,建立适用于化学领域文献命名识别的启发式规则,为专业领域的命名实体识别提供新的解决方案。对比实验证明本文的方法能有效提升专业命名识别的效率。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李楠
郑荣廷
吉久明
滕青青
关键词 化学物质命名识别   启发式规则领  域特征统计   语言特征  IUPAC    
Abstract

This paper proposes a method of domain name recognition based on heuristic rules, to overcome the shortage of traditional solution in specific domain. It firstly studies chemical name in Chinese to obtain its domain features and statistical language features, and then on the basis of such features,it puts forward several heuristic rules, which is applicable to domain name recognition of chemical literature. Comparison experiment shows this method can improve the efficiency of domain name recognition obviously.

Key wordsChemical name recognition       Heuristic rule        Domain feature        Statistical language feature      IUPAC
收稿日期: 2010-04-09     
: 

 

 
  TP391

 
通讯作者: 李楠     E-mail: ajen@ecust.edu.cn
引用本文:   
李楠 郑荣廷 吉久明 滕青青. 基于启发式规则的中文化学物质命名识别研究[J]. 现代图书情报技术, 2010, 26(5): 13-17.
Li Nan Zheng Rongting Ji JiumingTeng Qingqing. Research on Chinese Chemical Name Recognition Based on Heuristic Rules. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2010.05.03.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.05.03

1] 赵军.命名实体识别、排歧和跨语言关联[J].中文信息学报,2009,23(2):3-17.
[2] Grishman R, Sundhiem B. Design of the MUC-6 Evaluation[C]. In: Proceedings of the 6th Message Understanding Conference. NJ: Association for Computational Linguistics, 1995:1-11.
[3] Chen H H, Ding Y W, Tsai S C, et al. Description of the NTU System Used for MET-2[C]. In: Proceedings of the 7th Message Understanding Conference. 1998.
[4] Black W J, Rinaldi F, Mowatt D. Facile: Description of the NE System Used For MUC-7[C]. In: Proceedings of the 7th Message Understanding Conference. 1998.
[5] Sun J, Gao J F, Zhang L, et al. Chinese Named Entity Identification Using Class Based Language Model[C]. In: Proceedings of the 19th International Conference on Computational Linguistics. NJ: Association for Computational Linguistics, 2002: 1-7.
[6] Zhou G D, Su J. Named Entity Recognition Using an HMM Based Chunk Tagger[C]. In: Proceedings of the 40th Annual Meeting of the ACL. NJ: Association for Computational Linguistics, 2002: 473-480.
[7] Ramaparkhi A. A Simple Introduction to Maximum Entropy Models for Natural Language Processing[R]. Institute for Research in Cognitive Science, University of Pennsylvania, 1997.
[8] 刘建华,张智雄,徐健,等.自动术语识别——对科技文献进行文本挖掘的重要技术方法[J].现代图书情报技术,2008(8):12-17.
[9] Krauthammer M, Rzhetsky A, Morozov P, et al. Using BLAST for Identifying Gene and Protein Names in Journal Articles [J]. Gene, 2000, 259(1):245-252.
[10] 宋丹,孙济庆.基于规则的化学特征词自动标引研究[J].情报学报, 2009,28(5):689-692.
[11] Klinger R, Kolárik C, Fluck J, et al. Detection of IUPAC and IUPAC-like Chemical Names[J]. Bioinformatics, 2008, 24(13):268-276.
[12] 中国化学会.化学命名原则[M].北京:科学出版社,1984.

[1] 孙镇 王惠临. 命名实体识别研究进展综述[J]. 现代图书情报技术, 2010, 26(6): 42-47.
[2] 李晶 谭英 师俏梅. 三大索引收录论文邮件推送服务系统的设计与实现[J]. 现代图书情报技术, 2010, 26(6): 83-87.
[3] 邹荣 陈武 姜爱蓉 张成昱 远红亮. 清华大学图书馆网络升级方案设计与实现[J]. 现代图书情报技术, 2010, 26(5): 79-83.
[4] 化柏林, 郭江. 基于规则的高校实验室Web信息抽取的系统设计与实现*[J]. 现代图书情报技术, 2009, (10): 62-66.
[5] 邹荣,范爱红,姜爱蓉. 基于DSpace构建科研论文管理系统[J]. 现代图书情报技术, 2009, (10): 90-94.
[6] 张翼燕,杜薇薇, 高嵩. 长期订单管理系统的设计与实现[J]. 现代图书情报技术, 2009, (10): 86-89.
[7] 吴振新,姚飞,高建秀,孙敏杰. 2009国际数字对象保存会议(iPRES2009)综述——成为主流,保障我们数字化的未来[J]. 现代图书情报技术, 2009, (10): 1-6.
[8] 王建冬. 国外可用性研究进展述评[J]. 现代图书情报技术, 2009, (9): 7-16.
[9] 祝忠明,马建霞,卢利农,李富强,刘巍,吴登禄. 机构知识库开源软件DSpace的扩展开发与应用[J]. 现代图书情报技术, 2009, 25(7-8): 11-17.
[10] Hak Lae Kim, Simon Scerri, John G.Breslin, Stefan Decker, Hong Gee Kim. 最新标签本体:标签和民俗分类法语义模型[J]. 现代图书情报技术, 2009, 3(3): 30-37.
[11] 陈仕吉,史丽文,左文革. e-Science 环境下复合数字对象研究[J]. 现代图书情报技术, 2009, 3(2): 33-38.
[12] 姜彩红,乔晓东,朱礼军. 基于本体的专利摘要知识抽取*[J]. 现代图书情报技术, 2009, 3(2): 23-28.
[13] 邵增荣,李英,范体军. 正则表达式在油价事件网页提取中的应用*[J]. 现代图书情报技术, 2009, 3(2): 83-88.
[14] 吴政. 通用手机图书馆系统的设计与实现*[J]. 现代图书情报技术, 2009, 3(1): 98-104.
[15] 李峰,李春旺. Mashup关键技术研究[J]. 现代图书情报技术, 2009, 3(1): 44-49.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn