Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. Issue (10): 62-66     https://doi.org/10.11925/infotech.1003-3513.2009.10.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于规则的高校实验室Web信息抽取的系统设计与实现*
化柏林郭江2
1(中国科学技术信息研究所 北京 100038)
2(北京市旧机动车交易市场有限公司 北京 100070)
System Design and Implementation of University Laboratory Web Information Extraction Based on Rules
Hua BolinGuo Jiang2
1(Institute of Scientific and Technical Information of China, Beijing 100038, China)
2(Beijing Used Vehicle Trading Market Inc., Beijing 100070, China)
全文: PDF (501 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

在充分调研高校实验室信息的基础上,针对总结的实验室信息的规律与特征,制定适合信息抽取的实验室信息描述规则,利用规则进行实验室信息的抽取。设计一个针对高校实验室信息的信息抽取系统labIE,并详细论述labIE的体系结构与技术架构,着重论述网页表格判断规则的设计与特征谓词的构造方法。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
化柏林
郭江
关键词 实验室Web信息信息抽取规则特征谓词Web页面结构    
Abstract

This paper summarizes the laboratory information characters based on analysis of university laboratory Web information, which is used to formulate rules of laboratory Web information.It designs an information extraction system on university laboratory, and presents system architecture and technical architecture of labIE. It also describes the design of rules on table recognition and methodology of constructing characteristic predicate.

Key wordsLab Web information    Information extraction    Rules    Characteristic predicate    Web page structure
收稿日期: 2009-05-21      出版日期: 2009-10-25
ZTFLH: 

 

 
  TP391

 
基金资助:

*本文系国家自然科学基金青年项目“基于句子匹配分析的知识抽取研究与实现”(项目编号:70803048)的研究成果之一。

通讯作者: 化柏林      E-mail: huabolin@istic.ac.cn
作者简介: 化柏林, 郭江
引用本文:   
化柏林, 郭江. 基于规则的高校实验室Web信息抽取的系统设计与实现*[J]. 现代图书情报技术, 2009, (10): 62-66.
Hua Bolin,Guo Jiang. System Design and Implementation of University Laboratory Web Information Extraction Based on Rules. New Technology of Library and Information Service, 2009, (10): 62-66.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.10.11      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V/I10/62

[1] Muggleton S, Building W, Road P. Inverse Entailment and Progol[J]. New Generation Computing (Special issue on Inductive Logic Programming),1995, 13(3-4):245-286.
[2] DeJong G. An Overview of the FRUMP System[C]. In: Proceedings of Strategies for Natural Language Processing. Hillsdale, NJ:Lawrence Erlbaum Associates, 1982:149-176.
[3] Grishman R, Sundheim B. Message Understanding Conference-6: A Brief History[C].In: Proceedings of the 16th International Conference on Computational Linguistics.1996:466-471. 
[4]Automatic Content Extraction(ACE) Evaluation[EB/OL].[2009-02-20]. http://www.itl.nist.gov/iad/mig/tests/ace/.
[5] Grishman R,Huttunen S,Yangarber R.Information Extraction for Enhanced Access to Disease Outbreak Reports[J].Journal of Biomedical Informatics,2002,35(4):236-246.
[6] 陆伟, 韩曙光, 袁泽林,等.信息检索实验[M].武汉:武汉大学出版社,2008:6-26.
[7] 叶娜.面向信息抽取的文本预处理和规则自动学习技术研究[D].沈阳:东北大学,2005.
[8] 车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6.
[9] HTMLParser的两种使用[EB/OL].[2008-12-21]. http://jansener.javaeye.com/blog/205883.

[1] 李铁军,颜端武,杨雄飞. 基于情感加权关联规则的微博推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 27-33.
[2] 魏伟,郭崇慧,邢小宇. 基于语义关联规则的试题知识点标注及试题推荐*[J]. 数据分析与知识发现, 2020, 4(2/3): 182-191.
[3] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[4] 强韶华,罗云鹿,李玉鹏,吴鹏. 基于RBR和CBR的金融事件本体推理研究 *[J]. 数据分析与知识发现, 2019, 3(8): 94-104.
[5] 张勇,李树青,程永上. 基于频次有效长度的加权关联规则挖掘算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 85-93.
[6] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[7] 卢强,朱振方,徐富永,国强强. 融合语法规则的Bi-LSTM中文情感分类方法研究 *[J]. 数据分析与知识发现, 2019, 3(11): 99-107.
[8] 章成志,李铮. 基于学术论文全文的创新研究评价句抽取研究 *[J]. 数据分析与知识发现, 2019, 3(10): 12-18.
[9] 何跃, 丰月, 赵书朋, 马玉凤. 基于知乎问答社区的内容推荐研究——以物流话题为例[J]. 数据分析与知识发现, 2018, 2(9): 42-49.
[10] 牟冬梅, 金姗, 琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[11] 何跃, 王爱欣, 丰月, 王莉. 基于关联规则的门诊药房布局优化[J]. 数据分析与知识发现, 2018, 2(1): 99-108.
[12] 魏星, 胡德华, 易敏寒, 朱启贞, 朱文婕. 基于数据立方体挖掘疾病-基因-药物新关联*[J]. 数据分析与知识发现, 2017, 1(10): 94-104.
[13] 黄名选. 基于矩阵加权关联模式的印尼中跨语言信息检索模型*[J]. 数据分析与知识发现, 2017, 1(1): 26-36.
[14] 马天翼,张朋柱,冯浩垠. 网络外包任务的知识需求建模研究*[J]. 现代图书情报技术, 2016, 32(3): 74-81.
[15] 阮光册, 夏磊. 基于关联规则的文本主题深度挖掘应用研究*[J]. 数据分析与知识发现, 2016, 32(12): 50-56.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn