Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (12): 1-5     https://doi.org/10.11925/infotech.1003-3513.2007.12.01
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
数字图书馆中的ETL应用研究综述
黄永文李广建2
1(中国科学院国家科学图书馆 北京 100080)
2(北京师范大学管理学院 北京 100875)  
Review on the Application Reasearch of ETL in Digital Library
Huang YongwenLi Guangjian2
1(National Science Library,Chinese Academy of Sciences,Beijing  100080,China)
2(School of Management,Beijing Normal University, Beijing  100875,China)
全文: PDF (483 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

总结数字图书馆领域中与ETL相关的研究,在此基础上提出数字图书馆中ETL的分类,最后结合数字图书馆的应用需求和发展趋势,从ETL在数字图书馆资源建设、数字图书馆用户服务、实现数字图书馆与其他系统之间互操作3个方面,详细分析和研究数字图书馆中ETL的应用方式。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李广建
黄永文
关键词 数字图书馆ETL应用信息抽取数据清洗    
Abstract

The paper introduces some researches on ETL application in digital libraries,and analyzes classification and application field of ETL in resources construction,user service,resources sharing,system interoperability of digital libraries.

Key wordsDigital library    ETL application    Information extraction    Data cleaning
收稿日期: 2007-10-15      出版日期: 2007-12-25
: 

G250.76

 
通讯作者: 黄永文     E-mail: hyongwen@mail.las.ac.cn
作者简介: 黄永文,李广建
引用本文:   
黄永文,李广建. 数字图书馆中的ETL应用研究综述[J]. 现代图书情报技术, 2007, 2(12): 1-5.
Huang Yongwen,Li Guangjian. Review on the Application Reasearch of ETL in Digital Library. New Technology of Library and Information Service, 2007, 2(12): 1-5.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.12.01      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I12/1

[1] Simitsis A,Vassiliadis P,Sellis T.Optimizing ETL Processes in Data Warehouses[C].21st International Conference on Data Engineering (ICDE’05),2005 :564-575.
[2] Bolasco S,Canzonetti A,Federico M C,et al.Understanding Text Mining:A  Pragmatic Approach[C].In:Proceedings of the NEMIS 2004 Final Conference,2005:31-50.
[3] 张智雄.信息抽取技术及其在数字图书馆中的应用前景分析[J].现代图书情报技术,2004(6):1-5,23.
[4] 刘鲁红,刘力强,胡亚军.信息抽取技术在数字图书馆中的应用研究[J].情报理论与实践,2005,28(3):321-324.
[5] 刘剑兰,朱东华.信息抽取技术在情报监测中的应用[J].情报学报,2004,23(6):661-666.
[6] Jones S,Paynter G W.Automatic Extraction of Document Keyphrases for Use in Digital Iibraries:Evaluation and Applications[J].Journal of the American Society for Information Science and Technology,2002,53(2): 653-677.
[7] Wellner B,McCallum A,Peng F C,et al.An Integrated,Conditional Model of Information Extraction and Coreference with Application to Citation Matching[C/OL].[2007-05-20].Conference on Uncertainty in Artificial Intelligence (UAI),2004. http://www.cs.umass.edu/~mccallum/papers/integrated04uai.pdf.
[8] 李朝光,张铭,邓志鸿,等.论文元数据信息的自动抽取[J].计算机工程与应用,2002,38(21):189-191,235.
[9] 李向阳,张亚非.一种网上图书信息抽取方法[J].情报学报,2004,23(6):655-660.
[10] 胡金化,胡运发,周益群,等.面向中文文本数据库的信息抽取机制[J].小型微型计算机系统,2002,23(10):1161-1164.
[11] 奚伟鹏,李昕,蒋饥,等.面向网上论坛的信息抽取技术[J].计算机工程,2005,31(4):66-68.
[12] 冯伟华,苗长芬.基于Web的网页信息抽取方法的研究[J].洛阳工业高等专科学校学报,2005,15(3):30-31.
[13] 郭志红.基于Web资源的信息抽取技术[J].情报科学,2002,20(12):1282-1284.
[14] 王亮,朱征宇.基于扩展标记图的Web信息抽取器[J].计算机工程,2005,31(8):159-161,191.
[15] 张丙奇,姜吉发.企业相关信息抽取技术研究与系统实现[J].微电子学与计算机,2004,21(1):1-6.
[16] Bergmark D,Phempoonpanich P,Zhao S M.Scraping the ACM Digital Iibrary[J].ACM SIGIR Forum,2001,35(2):1-7.
[17] Zhang W D,Song Y J.Research on PDF Documents Information Extraction System Based-on XML[EB/OL].[2007-05-20].http://adt.caul.edu.au/etd2005/papers/057Zhang.pdf.
[18] 郭瑞华,张玉莉.语义Web上DC元数据的描述及抽取技术[J].现代情报,2005,25(6):212-214.
[19] 刘金红,夏阳,陆余良.基于Ontology的网络元数据抽取系统的研究与实现[J].安徽电子信息职业技术学院学报,2004,3(5):10-13.
[20] 陆科进,李新颖.基于Ontology的文本信息抽取[J].计算机应用研究,2003,20(7):46-48.
[21] 廖乐健,曹元大,李新颖.基于Ontology的信息抽取[J].计算机工程与应用,2002,38(23):110-113.
[22] Sarawagi S,Srinivasan S,Vydiswaran V G,et al.Resolving Citations in a Paper Repository[J].ACM SIGKDD Explorations Newsletter,2003,5(2):156-157.
[23] Ayres F H,Huggill J W,Yannakoudakis E J.The Universal Standard Bibliographic Code (USBC):Its Use for Clearing,Merging and Controlling Large Databases[J].Program,1998,22(2):117-132.
[24] Haseebulla M K,Kurt M,Mohammad Z.Similarity and Duplicate Detection System for an OAI Compliant Federated Digital Library[C].The 9th European Conference on Research and Advanced Technology for Digital Libraries,2005: 531-532.
[25] Shen R,Wang J,Edward A F.A Lightweight Protocol Between Digital Libraries and Visualization Systems[EB/OL].[2007-05-25].http://vw.indiana.edu/visual02/Shen.pdf.
[26] Griffin S,Merriman J.E-learning and the Digital Library——A Report on Collaboration Between IMS and OKI[EB/OL].[2007-05-25].CNI Fall Task Force Meeting,2002. http://www.cni.org/tfms/2002b.fall/PowerPoint/PPT-E-Learning.ppt.

[1] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[2] 陶玥,余丽,张润杰. 科技文献中短语级主题抽取的主动学习方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 134-143.
[3] 刘志强,都云程,施水才. 基于改进的隐马尔科夫模型的网页新闻关键信息抽取*[J]. 数据分析与知识发现, 2019, 3(3): 120-128.
[4] 章成志,李铮. 基于学术论文全文的创新研究评价句抽取研究 *[J]. 数据分析与知识发现, 2019, 3(10): 12-18.
[5] 牟冬梅, 金姗, 琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[6] 齐云飞, 赵宇翔, 朱庆华. 关联数据在数字图书馆移动视觉搜索系统中的应用研究*[J]. 数据分析与知识发现, 2017, 1(1): 81-90.
[7] 洪亮,钱晨,樊星. 移动数字图书馆资源的情境感知个性化推荐方法研究*[J]. 现代图书情报技术, 2016, 32(7-8): 110-119.
[8] 刘健,毕强,马卓. 数字图书馆微服务评价指标体系构建及实证研究*[J]. 现代图书情报技术, 2016, 32(5): 22-29.
[9] 段宇锋,黄思思. 中文植物物种多样性描述文本的信息抽取研究*[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[10] 刘伟, 王星, 宋培彦. 同义词抽取结果的噪音清洗方法研究[J]. 现代图书情报技术, 2015, 31(6): 64-70.
[11] 刘伙玉, 王东波. 面向论文相似性检测的数据预处理研究[J]. 现代图书情报技术, 2015, 31(5): 50-56.
[12] 王传清, 毕强. 数字图书馆自动化语义标注工具系统模型研究[J]. 现代图书情报技术, 2014, 30(6): 17-24.
[13] 尉萌. 利用演化模式做文献推荐[J]. 现代图书情报技术, 2014, 30(4): 20-26.
[14] 李湘东, 霍亚勇, 黄莉. 图书网页的自动识别及书目信息抽取研究[J]. 现代图书情报技术, 2014, 30(4): 71-77.
[15] 刘雅静, 王衍喜, 郝丹, 周津慧. 机构知识库支撑科研服务方法研究[J]. 现代图书情报技术, 2014, 30(3): 1-7.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn