Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (8): 18-23     https://doi.org/10.11925/infotech.1003-3513.2008.08.03
  专题 本期目录 | 过刊浏览 | 高级检索 |
实体关系抽取的技术方法综述*
徐健1,2,3  张智雄吴振新1
1(中国科学院国家科学图书馆 北京 100190)
2(中国科学院研究生院 北京 100049)
3(中山大学资讯管理系 广州  510275)
Review on Techniques of Entity Relation Extraction
Xu Jian1,2,3  Zhang ZhixiongWu Zhenxin1
1 (National Science Library, Chinese Academy of Sciences, Beijing 100190, China)
2(Graduate University of the Chinese Academy of Sciences, Beijing 100049,China)
3(Department of Information Management,Sun Yat-Sen University, Guangzhou 510275,China)
全文: PDF (373 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
徐健
吴振新
张智雄
关键词 实体关系抽取信息抽取关系抽取方法    
Abstract

 Entity relation extraction is a very important task in text information extraction domain. It first summarizes the development of entity relation extraction related to MUC and ACE, and then points out that main difficulties exist in the process of relation extraction are acquisition of training dataset, acquisition of templates, and co-reference resolution. Based on the analysis of recent related literatures, systems and projects, it concludes the entity relation extraction methods as follows:templates method, lexicon driven method, machine learning method, Ontology driven method, and hybrid method. The analysis of these methods can help to build more efficient entity relation extraction system in further step.

Key wordsEntity relation extraction    Information extraction    Relation extraction methods
收稿日期: 2008-06-16      出版日期: 2008-08-25
: 

G250.73

 
基金资助:

*本文系国家社会科学基金项目“从数字信息资源中实现知识抽取的理论和方法研究”(项目编号:05BTQ006)的研究成果之一。

通讯作者: 徐健     E-mail: xujian@mail.las.ac.cn
作者简介: 徐健,张智雄,吴振新
引用本文:   
徐健,张智雄,吴振新. 实体关系抽取的技术方法综述*[J]. 现代图书情报技术, 2008, 24(8): 18-23.
Xu Jian,Zhang Zhixiong,Wu Zhenxin. Review on Techniques of Entity Relation Extraction. New Technology of Library and Information Service, 2008, 24(8): 18-23.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.08.03      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I8/18

[1] Schutz A, Buitelaar P. RelExt:A Tool for Relation Extraction from Text in Ontology Extension[C]. 4th International Semantic Web Conference, Galway, Ireland, November 6-10, 2005:593-606.
[2] Katrenko S,  Adriaans P. Learning Relations from Biomedical Corpora Using Dependency Tree Levels[C]. In:Proc. BENELEARN conference(2006), 2006.
[3] Relationship Extraction[EB/OL]. [2008-05-30]. http://en.wikipedia.org/wiki/Relationship_extraction.
[4] The ACE 2004 Evaluation Plan[EB/OL]. [2008-05-30]. http://www.nist.gov/speech/tests/ace/2004/doc/ace04-evalplan-v7.pdf.
[5] Automatic Content Extraction 2008 Evaluation Plan (ACE08)[EB/OL]. [2008-05-30]. http://www.nist.gov/speech/tests/ace/2008/doc/ace08-evalplan.v1.2.pdf.
[6] MUC[EB/OL]. [2008-05-30]. http://www.itl.nist.gov/iaui/894.02/related_projects/muc/.
[7] ACE[EB/OL]. [2008-05-30]. http://www.nist.gov/speech/tests/ace/.
[8] ACE08 Annotation Tasks[EB/OL]. [2008-05-30]. http://projects.ldc.upenn.edu/ace/annotation/.
[9] 邓擘, 樊孝忠, 杨立公. 用语义模式提取实体关系的方法[J]. 计算机工程, 2007,33(10):212-214.
[10] 姜吉发, 王树西. 一种自举的二元关系和二元关系模式获取方法[J]. 中文信息学报, 2005,19(2):71-77.
[11] 顾雪峰. 基于动态粒度思想的实体关系识别方法研究[EB/OL]. [2008-05-30]. http://www.cnki.com.cn/grid20/Detail.aspx.
[12] 刘克彬, 李芳, 刘磊,等. 基于核函数中文关系自动抽取系统的实现[J]. 计算机研究与发展. 2007,44(8):1406-1411.
[13] 车万翔, 刘挺, 李生. 实体关系自动抽取[J]. 中文信息学报, 2005,19(2):1-6.
[14] Zhang Y M, Zhou J F. A Trainable Method for Extracting Chinese Entity Names and Their Relations[C]. In: Proceedings of the Second Chinese Language Processing Workshop, Hong Kong,  2000:66-72.
[15] Appelt D E, Hobbs J R,  Bear J, et al. SRI International FASTUS System:MUC-6 Test Results and Analysis[C]. In: Proceedings of the 6th Message Understanding Conference (MUC-6),  1995:237-248.
[16] Roman Y, Grishman R. NYU:Description of the Proteus/PET System as Used for MUC-7 ST[C]. In: Proceedings of the 6th Message Understanding Conference (MUC-7), 1998.
[17] Aone C, Ramos2Santacruz M. Rees:A large-scale relation and event extraction system[C]. In:Proc of the 6th Applied Natural Language Processing Conference, New York, 2000:76-83.
[18] Zhang Y,  Zhou J F. A Trainable Method for Extracting Chinese Entity Names and Their Relations[C]. In: Proceedings of the second Chinese Language Processing Workshop, ACL, 2000:66-72.
[19]  Zhu Z. Weakly-supervised Relation Classification for Information Extraction[C]. In:Proceedings of the Thirteenth ACM conference on Information and Knowledge Management, Washington D.C., 2004:581-588.
[20] Banko M, Cafarella M J, Soderland S, et al. Open Information Extraction from the Web[C]. In: Proceeding of the International Joint Conferences on Artificial Intelligence, 2007.
[21] Iria J. T-Rex:A Flexible Relation Extraction Framework[C]. In: Proceeding of the 8th Annual Colloquium for the UK Special Interest Group for Computational Linguistics (CLUK’05), Manchester, January 2005.
[22] Iria, Mr. José, Ciravegna, Fabio. Relation Extraction for Mining the Semantic Web[C]. In: Proceedings Machine Learning for the Semantic Web Dagstuhl Seminar 05071, Dagstuhl, 2005.
[23] Sabou M, Mathieu d’Aquin, Motta E. SCARLET:SemantiC relAtion DiscoveRy by Harvesting onLinE onTologies[C]. In: Proceedings of the 5th European Semantic Web Conference, June, 2008.
[24] Specia L, Motta E. A Hybrid Approach for Extracting Semantic Relations from Texts[EB/OL]. [2008-05-30]. http://www.dcs.shef.ac.uk/~lucia/publications/SpeciaMotta_OLP2-2006.pdf.

[1] 王一钒,李博,史话,苗威,姜斌. 古汉语实体关系联合抽取的标注方法*[J]. 数据分析与知识发现, 2021, 5(9): 63-74.
[2] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[3] 陶玥,余丽,张润杰. 科技文献中短语级主题抽取的主动学习方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 134-143.
[4] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[5] 章成志,李铮. 基于学术论文全文的创新研究评价句抽取研究 *[J]. 数据分析与知识发现, 2019, 3(10): 12-18.
[6] 牟冬梅, 金姗, 琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[7] 段宇锋,黄思思. 中文植物物种多样性描述文本的信息抽取研究*[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[8] 刘伟, 王星, 宋培彦. 同义词抽取结果的噪音清洗方法研究[J]. 现代图书情报技术, 2015, 31(6): 64-70.
[9] 李湘东, 霍亚勇, 黄莉. 图书网页的自动识别及书目信息抽取研究[J]. 现代图书情报技术, 2014, 30(4): 71-77.
[10] 刘雅静, 王衍喜, 郝丹, 周津慧. 机构知识库支撑科研服务方法研究[J]. 现代图书情报技术, 2014, 30(3): 1-7.
[11] 翟东升, 张欣琦, 张杰, 康宁. 分布式专利信息抽取系统设计与构建[J]. 现代图书情报技术, 2013, 29(7/8): 114-121.
[12] 张晗, 刘双梅. 中心度指标对语义述谓网络概念抽取的比较分析——以疾病治疗学研究为例[J]. 现代图书情报技术, 2013, (6): 30-35.
[13] 黄勋, 游宏梁, 于洋. 关系抽取技术研究综述[J]. 现代图书情报技术, 2013, 29(11): 30-39.
[14] 何琳, 何娟, 沈耕宇, 杨波, 黄水清. 一种通过文本挖掘发现实时定量聚合酶链式反应实验内参基因的方法研究[J]. 现代图书情报技术, 2012, 28(7): 109-114.
[15] 高强, 游宏梁. 基于层叠模型的国防领域命名实体识别研究[J]. 现代图书情报技术, 2012, (11): 47-52.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn