Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (4): 7-11     https://doi.org/10.11925/infotech.1003-3513.2008.04.02
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
元数据自动抽取研究新进展*
曾苏1,2 马建霞1 张秀秀1
1(中国科学院国家科学图书馆兰州分馆 兰州 730000)
2(中国科学院研究生院 北京 100049)
New Development of Automatic Metadata Extraction
Zeng Su1,2  Ma JianxiaZhang Xiuxiu1
1 (The Lanzhou Branch of the National Science Library, Chinese Academy of Sciences, Lanzhou 730000,China)
2 (Graduate University of Chinese Academy of Sciences, Beijing 100049,China)
全文: PDF (333 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

 分析元数据自动抽取的现实需求,对元数据自动抽取的相关研究进行阐述,然后对DROID、 NLNZ Metadata Extractor、Metadata Miner Catalogue PRO 3种典型的元数据自动抽取器进行分析比较;在讨论目前元数据自动抽取技术局限性的基础上,对该技术进行总结和展望。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
曾苏
马建霞
关键词 元数据自动抽取抽取器    
Abstract

 This paper analyses realistic demands of automatic metadata extraction, elaborates related research on automatic metadata extraction and compares three typical automatic extractors of metadata, including DROID, NLNZ Metadata Extractor and Metadata Miner Catalogue PRO. On the basis of discussing present limitations of automatic metadata extraction, the authors give a summary and prediction of this technology.

Key wordsMetadata    Automatic extraction    Extractor
收稿日期: 2007-12-17      出版日期: 2008-04-25
ZTFLH: 

G250.76

 
基金资助:

*本文系国家社会科学基金项目“机构知识库建设与应用研究”(项目编号:07BTQ019)的研究成果之一。

通讯作者: 曾苏     E-mail: zengs@mail.las.ac.cn
作者简介: 曾苏,马建霞,张秀秀
引用本文:   
曾苏,马建霞,张秀秀. 元数据自动抽取研究新进展*[J]. 现代图书情报技术, 2008, 24(4): 7-11.
Zeng Su,Ma Jianxia,Zhang Xiuxiu. New Development of Automatic Metadata Extraction. New Technology of Library and Information Service, 2008, 24(4): 7-11.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.04.02      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I4/7

[1] Dublin Core Metadata Editor[EB/OL].[2007-11-08].http://www.ukoln.ac.uk/metadata/dcdot/.
[2] Liu Y, Bai K, Mitra P, et al. TableSeer: Automatic Table Metadata Extraction and Searching in Digital Libraries[EB/OL]. [2007-11-10]. http://delivery.acm.org/10.1145/1260000/1255193/p91-liu.pdf?key1=1255193&key2=9007077911&coll=GUIDE&dl=GUIDE&CFID=9677192&CFTOKEN=66821516.
[3] Day M Y, Tsai R T, Sung C L, et al. Reference Metadata Extraction Using a Hierarchical Knowledge Representation Framework[J]. Decision Support Systems, 2007(43): 152-167.
[4] Cortezl E, da Silval A S, Goncalves M A, et al. FLUX-CIM: Flexible Unsupervised Extraction of Citation Metadata[EB/OL]. [2007-12-18]. http://delivery.acm.org/10.1145/1260000/1255219/p215-cortez.pdf?key1=1255219&key2=9296088911&coll=GUIDE&dl=GUIDE&CFID=10613840&CFTOKEN=55320929/.
[5] Hu Y H, Li H, Cao Y B, et al. Automatic Extraction of Titles from General Documents Using Machine Learning[J]. Information Processing and Management , 2006,42(1):1276-1293.
[6] 贺亚锋. Web站点元数据自动生成工具介绍[J]. 图书馆杂志, 2001,20(1): 28-30.
[7] Xue Y W,  Hu Y H, Xin G M, et al. Web Page Title Extraction and Its Application[J]. Information Processing and Management, 2007 (43): 1332-1347.
[8] Yu J D,  Fan X Z. Metadata Extraction from Chinese Research Papers Based on Conditional Random Fields[EB/OL]. [2007-12-01]. http://210.37.44.253/nc2007/fskd2007/data/Volume%201/105-1-Chinese%20Research%20Papers.pdf.
[9] 李朝光, 张铭, 邓志鸿, 等. 论文元数据信息的自动抽取[J]. 计算机工程与应用, 2002,38(21): 189-191,235.
[10] DROID[EB/OL].[2007-11-22].http://droid.sourceforge.net/wiki/index.php/Introduction.
[11] Metadata Extraction Tool[CP/OL].[2007-12-03].http://sourceforge.net/projects/meta-extractor/.
[12] Nation Library of New Zealand.[2007-12-05].http://www.natlib.govt.nz/about-us/current-initiatives/metadata-extraction-tool/.
[13] Catalogue PRO[EB/OL]. [2007-12-08]. http://peccatte.karefil.com/software/Catalogue/catalogueDK.htm/.
[14] Main Features of Catalogue[EB/OL]. [2007-12-10].http://peccatte.karefil.com/software/Catalogue/CatalogueENG.htm/.
[15] Implementing the PREMIS Data Dictionary: A Survey of Approaches[EB/OL]. [2007-12-16]. http://www.loc.gov/standards/premis/implementation-report-woodyard.pdf/.

[1] 李旭晖,于滔,李婷,李逸文,顾进广. 一种面向演化的模式元数据描述机制*[J]. 数据分析与知识发现, 2020, 4(1): 76-88.
[2] 张金柱,胡一鸣. 融合表示学习与机器学习的专利科学引文标题自动抽取研究*[J]. 数据分析与知识发现, 2019, 3(5): 68-76.
[3] 姜霖, 王东波. 引文元数据的自动发现和标注方法研究——以外文引文为例[J]. 数据分析与知识发现, 2017, 1(1): 47-54.
[4] 刘庆祥,张朋柱,张晓燕,刘景方. 网络环境下人才知识结构的自动抽取方法*[J]. 现代图书情报技术, 2016, 32(4): 56-63.
[5] 于倩倩,张建勇. NSTL集成利用第三方来源元数据的实践与探索*[J]. 现代图书情报技术, 2016, 32(1): 97-102.
[6] 刘峰, 张晓林. 科学数据元数据标准述评及其通用化设计研究[J]. 现代图书情报技术, 2015, 31(12): 3-12.
[7] 王辉, Michael Witt, 窦天芳. 普渡大学研究仓储及其支持的科学数据管理服务[J]. 现代图书情报技术, 2015, 31(1): 9-16.
[8] 谭学清, 何珊. 音乐个性化推荐系统研究综述[J]. 现代图书情报技术, 2014, 30(9): 22-32.
[9] 曾文,徐硕,张运良,翟娟华. 科技文献术语的自动抽取技术研究与分析*[J]. 现代图书情报技术, 2014, 30(1): 51-55.
[10] 程妍妍. 国际电子文件元数据封装方法VEO和METS的比较研究[J]. 现代图书情报技术, 2011, 27(10): 7-11.
[11] 周静, 赵英, 杨欣. 基于CWM的ETL元数据库系统模型的设计[J]. 现代图书情报技术, 2011, 27(1): 88-93.
[12] 沈芸芸, 肖珑, 冯英. 元数据应用规范研究[J]. 现代图书情报技术, 2010, 26(12): 1-8.
[13] 张春红, 唐勇, 邵珂. 图像资源数字加工标准及其应用[J]. 现代图书情报技术, 2010, 26(12): 9-14.
[14] 周玉陶, 范国银. 学位论文OAI-METS元数据生成的实现[J]. 现代图书情报技术, 2010, 26(10): 91-94.
[15] 韩莹,祝忠明. 数字对象情境元数据研究及应用进展[J]. 现代图书情报技术, 2009, 25(6): 24-30.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn