Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (10): 38-41     https://doi.org/10.11925/infotech.1003-3513.2007.10.09
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于NLP的知识抽取系统架构研究*
化柏林
(中国科学技术信息研究所 北京 100038)
Architecture of Knowledge Extraction Based on NLP
Hua Bolin
(Institute of Scientific and Technical Information of China, Beijing 100038,China)
全文: PDF (547 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

在参考自然语言处理平台及知识抽取系统的系统结构的基础上,提出一个基于NLP的知识抽取系统的详细设计方案。自然语言处理过程包括分词、词性标注、句法分析、语义分析等8大模块;知识抽取过程包括论文类型分析、篇章结构分析、知识抽取、知识表示4大模块。通过对基于NLP的知识抽取系统架构的研究,明确自然语言处理与知识抽取的关系,分析出知识抽取的系统流程及关键技术。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
化柏林
关键词 自然语言处理知识抽取文献分析内容分析系统架构关键技术    
Abstract

Based on the studies of system architecture of NLP platform and knowledge extraction system, the author brings forth a detailed resolution on how to design a knowledge extraction system based on NLP. NLP technique includes eight modules, such as segmentation, part-of speech tag, syntactic analysis and semantic analysis. Knowledge extraction includes four modules, such as documents type analysis, discourse analysis, knowledge extraction and knowledge representation. Research on system architecture of knowledge extraction based on NLP is beneficial to not only find relations between NLP and knowledge extraction, but also analyze system flow and critical technology of knowledge extraction.

Key wordsNatural Language Processing(NLP)    Knowledge extraction    Document analysis    Content analysis    System architecture    Critical technology
收稿日期: 2007-07-04      出版日期: 2007-10-25
ZTFLH: 

G35 

 
     
  TP391

 
基金资助:

* 本文系中国科学技术信息研究所预研基金项目“知识抽取系统架构与关键技术研究”(项目编号:YY2006018)的研究成果之一。

通讯作者: 化柏林      E-mail: huabolin@istic.ac.cn
作者简介: 化柏林
引用本文:   
化柏林 . 基于NLP的知识抽取系统架构研究*[J]. 现代图书情报技术, 2007, 2(10): 38-41.
Hua Bolin. Architecture of Knowledge Extraction Based on NLP. New Technology of Library and Information Service, 2007, 2(10): 38-41.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.10.09      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I10/38

[1] Jionghua Ji.Semi-automatic Ontology-based Knowledge Extraction and Verification From Unstructured Document[D]. State University System of Florida,2000
[2] Von-Wun Soo, Hsiang-Yuen Yeh, Shih-Neng Lin,et al.Ontology-based Knowledge Extraction from Semantic Annotated Biological Literature[C]The Ninth Conference on Artificial Intelligence and Applications, 2004
[3] 化柏林,赵亮.知识抽取中的嵌套向量分词技术[J].现代图书情报技术,2007(7):50-53
[4] 刘开瑛.中文文本自动分词和标注[M].北京:商务印书馆,2000
[5] Brown P F,Della Pietra S A,Della Pietra V J,et al.Word-sense Disambiguation Using Statistical Methods[EB/OL].[2007-07-05]http://acl.ldc.upenn.edu/P/P91/P91-1034.pdf
[6] Yarowsky D. Decision List for Lexical Ambiguity Resolution:Application to Accent Restoration in Spanish and Freneh[C].Proceedings of 32nd Annual Meeting of the Association for Computational Linguistics,Las Cruces,NM,1994
[7] Kaplan,Ronald M. The Formal Architecture of Lexical-Functional Grammar[J]. Journal of Information Science and Engineering,1989,5:305-322.
[8] Jean-Pierre Koenig. Book Reviews: Head-driven Phrase Structure Grammar and German in Head -driven Phrase Structure Grammar[EB/OL].[2007-07-06].http://acl.ldc.upenn.edu/J/J96/J96-1005.pdf
[9] 温有奎,温浩,徐端颐,等.基于知识元的文本知识标引[J].情报学报,2006(3):282-288
[10] John F.Sowa.知识表示(英文版)[M].北京:机械工业出版社,2003

[1] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[2] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[3] 石静,厉臣璐,钱宇星,周利琴,张斌. 国内外健康问答社区用户信息需求对比研究*——基于主题和时间视角的实证分析[J]. 数据分析与知识发现, 2019, 3(5): 1-10.
[4] 徐红霞,李春旺. 科技文献内容知识点抽取研究综述[J]. 数据分析与知识发现, 2019, 3(3): 14-24.
[5] 徐浩,朱学芳,章成志,江川. 面向学术文献全文本的方法论知识抽取系统分析与设计 *[J]. 数据分析与知识发现, 2019, 3(10): 29-36.
[6] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[7] 杨春雷. 面向语用消歧的量化约束条件系统: 从语言学设计到计算实现*[J]. 数据分析与知识发现, 2017, 1(11): 1-11.
[8] 吴聪, 赵宇翔, 朱庆华. 基于任务展示示能性的众筹项目视频分析*——以众筹网为例[J]. 数据分析与知识发现, 2017, 1(10): 64-76.
[9] 刘建华, 王颖, 张智雄, 李传席. 植物物种多样性语义知识抽取研究*[J]. 数据分析与知识发现, 2017, 1(1): 37-46.
[10] 杨春雷. 基于HPSG的汉语词库和语法规则系统构建*[J]. 现代图书情报技术, 2016, 32(7-8): 129-136.
[11] 刘天祎,步一,赵丹群,黄文彬. 自动引文摘要研究述评[J]. 现代图书情报技术, 2016, 32(5): 1-8.
[12] 彭浩, 徐健, 肖卓. 基于比较句的网络用户评论情感分析[J]. 现代图书情报技术, 2015, 31(12): 48-56.
[13] 杨春雷, Dan Flickinger. 汉构:面向深层语言处理的语法工程[J]. 现代图书情报技术, 2014, 30(3): 57-64.
[14] 邱均平, 方国平. 基于知识图谱的中外自然语言处理研究的对比分析[J]. 现代图书情报技术, 2014, 30(12): 51-61.
[15] 佘贵清, 张永安. 审判案例自动抽取与标注模型研究[J]. 现代图书情报技术, 2013, (6): 23-29.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn