Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (1): 75-81     https://doi.org/10.11925/infotech.1003-3513.2015.01.11
  应用论文 本期目录 | 过刊浏览 | 高级检索 |
DROID开源工具在长期保存系统格式识别中的应用
王玉菊, 吴振新, 孔贝贝, 付鸿鹄
中国科学院文献情报中心 北京 100190
Application of DROID About Format Identification in Long-term Preservation System
Wang Yuju, Wu Zhenxin, Kong Beibei, Fu Honghu
National Science Library, Chinese Academy of Sciences, Beijing 100190, China
全文: PDF (1000 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的] 在数字资源长期保存系统(DPS)中应用开源格式识别工具获取复杂对象的格式信息。[应用背景] 在现有开源工具的基础上, 为满足DPS的实际需求、保障效率和执行效果, 需选择合适的工具进行二次开发和集成应用。[方法] 分析比较现有两种常用工具, 选取DROID作为DPS的格式识别工具, 同时针对DPS效率要求, 提出选用DROID批量格式识别的处理思路, 并对其进行有效封装。[结果] 将DROID封装为"DPS的批量格式处理模块"并在DPS格式识别及技术元数据抽取中得到实际应用。[结论] DROID是一个优秀的开源工具, 其自动批处理特性基本满足DPS格式处理需求。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王玉菊
付鸿鹄
孔贝贝
吴振新
关键词 格式识别长期保存复杂对象    
Abstract

[Objective] Integrate open source file-format identification tool into Digital Preservation System (DPS) to get complex object format information. [Context] Based on the existing open source tools, to meet the practical requirements, the DPS needs choose appropriate tools for application integration. [Methods] Analyze and compare several open source file-format identification tools. According to the practical requirements, DROID has been chosen for the DPS. At the same time to meet the efficiency requirements of DPS, an idea of choosing DROID batch format identification of complex objects is proposed. [Results] Batch format processing module which is integrated with DROID is utilized to complete format identification of complex objects and technical metadata extraction. [Conclusions] DROID is an excellent open source tool, of which the automatic batch processing can meet the requirements of DPS.

Key wordsFormat identification    Long-term preservation    Complex object
收稿日期: 2014-07-21      出版日期: 2015-02-12
:  TP393  
通讯作者: 王玉菊,ORCID:0000-0003-2539-2218,E-mail:wangyj@mail.las.ac.cn。     E-mail: wangyj@mail.las.ac.cn
作者简介: 作者贡献声明: 王玉菊: 设计研发方案, 源码分析, 二次开发, 论文撰写, 论文修改; 吴振新: 提出研究命题和优化方案, 论文最终版本修订; 孔贝贝: 性能优化; 付鸿鹄: 参与源码分析和系统开发。
引用本文:   
王玉菊, 吴振新, 孔贝贝, 付鸿鹄. DROID开源工具在长期保存系统格式识别中的应用[J]. 现代图书情报技术, 2015, 31(1): 75-81.
Wang Yuju, Wu Zhenxin, Kong Beibei, Fu Honghu. Application of DROID About Format Identification in Long-term Preservation System. New Technology of Library and Information Service, 2015, 31(1): 75-81.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.01.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2015/V31/I1/75

[1] Abrams S. File Formats[OL].[2014-07-15]. http://www.dcc. ac.uk/resources/curation-reference-manual/completed-chapters/file-formats.
[2] JHOVE - JSTOR/Harvard Object Validation Environment [EB/OL]. [2014-07-15]. http://jhove.sourceforge.net/.
[3] Chapter 4: DAITSS Preservation Services [EB/OL]. (2011-10-25). [2014-07-15]. https://share.fcla.edu/FDAPublic/DAITSS/Chapter_4_Preservation_Services.pdf.
[4] Portico Content Type Action Plan: Technical Artifacts [EB/OL]. (2009-08-05). [2014-07-15]. http://www.portico.org/digital- preservation/wp-content/uploads/2011/03/Portico-Content- Type-Action-Plan-Technical-Artifacts.pdf.
[5] Universal Archiving Module [EB/OL]. [2014-07-15]. http://rahvusarhiiv.ra.ee/en/universal-archives-module-2/.
[6] Kopal Library for Retrieval and Ingest[EB/OL].(2009-05-06). [2014-07-15]. http://kopal.langzeitarchivierung.de/index_koLibRI.php.de.
[7] File Profiling Tool (DROID) [EB/OL]. [2014-07-15]. http://www.nationalarchives.gov.uk/information-management/manage-information/policy-process/digital-continuity/file-profiling-tool-droid/.
[8] Integrating Planets and Fedora Commons [EB/OL]. (2010- 08-11). [2014-07-15]. http://www.planets-project.eu/publications/.
[9] Hitchcock S, Hey J, Brody T, et al.Laying the Foundations for Repository Preservation Services [R/OL]. (2007-03-07). [2014- 07-15]. http://www.portico.org/digital-preservation/wp-content/uploads/2011/03/Portico-Content-Type-Action-Plan-Technical- Artifacts.pdf.
[10] PRONOM - The Online Registry of Technical Information [EB/OL]. [2014-07-15]. http://www.nationalarchives.gov.uk/pronom/.
[11] DROID: How to Use It and How to Interpret Your Results [OL]. [2014-08-18]. http://www.nationalarchives.gov.uk/documents/information-management/droid-how-to-use-it-and-interpret-results.pdf.

[1] 郑建程, 张晓林, 赵艳, 吴振新, 尹高磊, 肖曼, 陈秀娟. 数字文献资源长期保存可持续支撑机制研究[J]. 数据分析与知识发现, 2016, 32(12): 1-8.
[2] 张梦霞,顾立平. 数据监管的政策研究综述*[J]. 现代图书情报技术, 2016, 32(1): 3-10.
[3] 吴振新, 王玉菊, 付鸿鹄, 李春旺, 刘建华. 构建可信赖的数字资源长期保存系统摄入工作流[J]. 现代图书情报技术, 2015, 31(3): 1-7.
[4] 吴振新. 长期保存中的数字对象不变性研究[J]. 现代图书情报技术, 2014, 30(11): 1-9.
[5] 马宁宁, 李超, 曲云鹏. 面向数字资源长期保存的自动过时风险管理系统的设计与实现[J]. 现代图书情报技术, 2013, (4): 69-76.
[6] 师洪波, 吴振新. Fedora CMA解析[J]. 现代图书情报技术, 2011, 27(7/8): 8-13.
[7] 高建秀 吴振新 孙硕. 云存储在数字资源长期保存中的应用探讨[J]. 现代图书情报技术, 2010, 26(6): 1-6.
[8] 姚飞,姜爱蓉. 欧盟长期保存项目Planets的体系与特点[J]. 现代图书情报技术, 2010, 26(2): 12-16.
[9] 吴振新,向菁. 开源长期保存系统DAITSS研究[J]. 现代图书情报技术, 2009, 25(7-8): 18-22.
[10] 吴振新,姚飞,高建秀,孙敏杰. 2009国际数字对象保存会议(iPRES2009)综述——成为主流,保障我们数字化的未来[J]. 现代图书情报技术, 2009, (10): 1-6.
[11] 沈玉兰,张爱霞 . 国家科技计划项目信息资源长期保存的技术标准化框架及其应用[J]. 现代图书情报技术, 2008, 24(4): 1-6.
[12] 张晓林,郑建程,李欣. 数字文献资源长期保存协议框架*[J]. 现代图书情报技术, 2008, 24(11): 1-6.
[13] 陈家翠,阮学平,靳茜,平海凤,沈东婧 . 基于Ontology的医学影像数字图书馆构想[J]. 现代图书情报技术, 2007, 2(2): 86-89.
[14] 吴振新,刘建华,张玫,赵琦,向菁. 数字资源长期保存:当前进展和最佳实践——2007年数字资源长期保存国际会议(iPRES2007)综述[J]. 现代图书情报技术, 2007, 2(11): 1-6.
[15] 李春旺 . LOCKSS插件技术与中文期刊Plugin开发[J]. 现代图书情报技术, 2006, 1(8): 60-64.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn