Advanced Search
  首页 > 行业动态
OCLC为WorldCat中100万最被广泛持有的作品提供关联数据文件下载

OCLC为WorldCat中100万最被广泛持有的作品提供关联数据文件下载

  OCLC于近期开始出版WorldCat中被广泛持有的作品的书目关联数据,并提供下载。这些可下载的关联数据描述了近120万份资源,含有近8000万个关联数据“三元组”,精确地描述了离散信息之间的关系。
  “这对于图书馆和关联数据来说都迈出了重要的一步。”OCLC技术推广员RichardWallis指出,“致力于开发关联数据相关服务的组织机构在投入全面开发之前,可以先用OCLC的这些数据来做实验。这一型的、重要的、最新的图书馆关联数据还可用于为新服务做压力测试。我们很期待看到大家将如何利用这些数据。”
  这些关联数据以RDF序列化的形式提供,使用Schema.org本体,以及Schema.org本体的图书馆扩展,使用需遵循ODCBY数据许可协议,整个数据以一个单一的1GB大小的GZip格式压缩文件提供,其下载址是:http://purl.oclc.org/dataset/WorldCat/datadumps/WorldCatMostHighlyHeld-2012-05-15.nt.gz.
  尽管WorldCat所覆盖的书目记录超过2.75亿条,这一批关联数据却只选择其中的最被广泛持有的作品,以免生成的关联数据过大。参与了大部分生成关联数据文件建模工作的OCLC研究中心软件架构师JeffYoung指出,“选择用于生成关联数据的资源至少要被250家图书馆持有。这是多方平衡的结果,既能为用户提供能被广泛使用的数据,同时还保证其大小在合理范围之内。”
  “OCLC希望这些关联数据能成为有用的原始数据。而且我们所使用的数据格式能保证与著作、著者以及出版商有关的信息能够非常方便地提取并重组。”Young认为,“对于图书馆学领域的科研人员,以基于WorldCat的数据从事文化、历史、社会等研究的学者来说,这无疑是一个很好的工具。”
  OCLC创新副总裁MikeTeets补充说:“这一批数据将有利于整个关联数据界,包括供应商、零售机构、科研人员以及学者等,将图书馆信息链入到他们的工作数据之中。同时也有利于图书馆将他们的资源过人们平时生活中所使用的服务与整个网络进行关联。”
  2012年6月,OCLC增加Schema.org标记到WorldCat.org的记录中,改善了图书馆信息在搜索引擎中的表示方式。此后,OCLC还为杜威十进制分类系统、FAST(主题术语的分面应用),以及VIAF(虚拟国际规范文档)服务开发了关联数据资源。这一批的120万份资源的关联数据也是OCLC关联数据战略的一部分。
  (编译自:http://www.oclc.org/us/en/news/releases/2012/201252.htm)

发布时间: 2013-05-14   浏览: 402
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn