Advanced Search
 
公 告
作者指南
行业动态
  首页 > 行业动态
OCLC研究中心为Europeana数据集开发语义相似度计算算法

OCLC研究中心为Europeana数据集开发语义相似度计算算法

  OCLC和Europeana正在合作探索如何为Europeana.edu中的数百万数字资源构建语义链接,改进其中的“相似条目”浏览功能。
  Europeana是欧洲的数字图书馆、档案馆和博物馆。Europeana的平台和专业知识网络促进了图书馆员、策展人和档案保管员的研究工作以及他们之间的知识交换,用数字创新和创意产业将他们联系在一起。目前Europeana为用户提供来自2 200个合作组织的超过2 400万的图书、绘画、电影、录音、照片和档案记录的访问功能,其界面以29种语言进行展示。
  从这些异构的数据集中收集元数据造成了一些质量问题,如重复、对象描述的粒度不一致、同一对象的不同描述版本的模糊不清等。因此,Europeana和OCLC研究中心合作探索识别有关联的对象并创建语义链接的创新方法。这些有关联的对象包括:同一出版物的不同语言翻译版本、一幅画和该画的照片、同一本书的不同版本等。
  OCLC研究中心在元数据质量改善技术和方法上,如针对复制品和原件或是不同编目语言的重复检测和相似元数据聚类,有非常丰富的经验和专业知识。此外,OCLC研究中心正在尝试自动进行数据记录和虚拟国际规范文档(VIAF)以及其他关联数据元素之间的链接。OCLC在改进数据质量和丰富数据内容上所作的工作遵循了其使得元数据更能为图书馆所用和改善终端用户体验的宗旨。
  Europeana和OCLC研究中心的这一合作将造福于这两个组织以及他们的合作伙伴们,而且也为数据内容丰富创造了新的机遇。该项目的研究成果将会被纳入Europeana数据模型(EDM)中,EDM旨在改进Europeana.eu访问者的浏览体验。此外,数据集的丰富方法和技术将被应用于后续的研究工作之中,指引科研人员走向更加创造性的方向,有助于他们开发出新的数据服务。
  (编译自: http://www.oclc.org/research/news/2012/08-20.html)

发布时间: 2013-04-25   浏览: 188
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn