Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (5): 62-68     https://doi.org/10.11925/infotech.1003-3513.2007.05.15
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于层次模式匹配的命名实体识别模型
王昊
(南京大学信息管理系 南京 210093)
Named Entity Extraction Model Based on Hierarchical Pattern Matching
Wang Hao
(Department of Information Management,Nanjing University,Nanjing 210093,China)
全文: PDF (857 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

重点讨论非结构化中文文本中表达式命名实体(ENE)的抽取和分类过程,尝试构造匹配模式集合,建立基于层次模式匹配的ENE识别模型(HPM_ENE_EM),作为竞争情报系统、用户兴趣度获取等情报学应用研究的基础,并以学术论文中的术语缩略语识别为例探讨该模型的具体应用。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王昊
关键词 表达式命名实体层次模式匹配术语识别缩略语    
Abstract

This paper emphasizes the process of extraction and classification of Expression Named Entity(ENE) in non-structured Chinese text, attempts to construct pattern collection for matching and builds the ENE Extraction Model Based Hierarchical Pattern Matching(HPM_ENE_EM), which is the base of the application research on intelligence, such as Competitive Intelligence System(CIS),user interest degree gaining and so on. At last, the paper discusses the detailed application of this model used for extracting the abbreviative terms in academic papers.

Key wordsExpression named entity    Hierarchical pattern matching    Term extraction    Abbreviative terms
收稿日期: 2007-03-26      出版日期: 2007-05-25
: 

TP311

 
通讯作者: 王昊     E-mail: ywhaowang810710@sina.com
作者简介: 王昊
引用本文:   
王昊 . 基于层次模式匹配的命名实体识别模型[J]. 现代图书情报技术, 2007, 2(5): 62-68.
Wang Hao . Named Entity Extraction Model Based on Hierarchical Pattern Matching. New Technology of Library and Information Service, 2007, 2(5): 62-68.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.05.15      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I5/62

1王睿, 张洁, 张由仪等. 基于混合模型的中文命名实体抽取系统. 清华大学学报(自然科学版), 2005(S1):1908-1914
2Chen H H, Ding Y W, Tsa S C, et a1. Description of the NITU System Used for MET2. In: Proc. of 7th Message Understanding Conference, 1998
3B1ack W J, Rinaldi F, Mowatt D. Facile: Description of the NE System Used For MUC-7. In: Proc. of 7th Message Understanding Conf, 1998
4Fukumoto J, Shimohata M, Masui F,et al. Electric Industry: Description of the Oki System as Used for MET-2. In: Proc. of 7th Message Understanding Conf, 1998
5Berners-Lee T, Fischetti M,Dertouzos T M. Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by its Inventor. Harper, San Francisco. 1999
6Zhou G D, Su J. Named Entity Recognition using an HMM-based Chunk Tagger. In: Proc. of the 40th Annual Meeting of the ACL,Philadelphia, PA 2002, 473-480
7Bender O,Och F J,Ney H. Maximum Entropy Models for Named Entity Recognition, Proceedings of the Conference on Computational Natural Language Learning. Edmonton, Canada, 2003, 148-151
8庄明, 老松杨, 吴玲达. 一种统计和词性相结合的命名实体发现方法. 计算机应用, 2004(01):22-24
9王胜, 朱明. 基于最大熵马尔可夫模型的地址信息抽取. 计算机工程与应用, 2005(21):192-194

[1] 何远标, 乐小虬, 张帆. 学术论文大纲中关键术语抽取方法研究[J]. 现代图书情报技术, 2014, 30(3): 73-79.
[2] 谷俊. 专利文献中新技术术语识别研究[J]. 现代图书情报技术, 2012, (11): 53-59.
[3] 叶春蕾, 冷伏海. 科技文献全文主题识别方法实证研究[J]. 现代图书情报技术, 2012, 28(1): 53-57.
[4] 白如星,张成昱,王茜. 基于缩略语转换的手机图书馆发布信息预处理机制初探*[J]. 现代图书情报技术, 2010, 26(3): 64-70.
[5] 许德山, 张智雄, 王峰, 邢美凤. 上下文分析与统计特征相结合的英文术语抽取研究[J]. 现代图书情报技术, 2010, 26(12): 28-33.
[6] 刘建华,张智雄,徐健,许雁冬. 自动术语识别——对科技文献进行文本挖掘的重要技术方法*[J]. 现代图书情报技术, 2008, 24(8): 12-17.
[7] 岑咏华,韩哲,季培培. 基于隐马尔科夫模型的中文术语识别研究[J]. 现代图书情报技术, 2008, 24(12): 54-58.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn