Advanced Search
  首页 > 行业动态
补充计量的五大挑战:从工具开发的角度来谈

补充计量的五大挑战:从工具开发的角度来谈

    在为测量学术关注开发新工具的驱动下,补充计量学成为信息计量学领域一个蓬勃发展的新方向。想在补充计量领域分一杯羹的公司如雨后春笋,这些公司经常会碰到各种挑战,例如:如何确定应该测量什么,如何从不同的数据源中收集准确的数据,如何解读海量的数据。

    (1)可以测量什么以及应该测量什么?

    虽然补充计量这个词泛指对再利用、参与情况以及影响力的非传统评价,但是往往还是主要强调对影响力的评价。尽管如此,影响是个多方位的概念,对于什么样的影响是重要的以及影响所作用的语境,不同的受众有不同的观点:研究者关心的往往是他们的研究成果是否对同行有所影响;基金往往关注学术成果是否被重复利用以及公众的参与情况;大学往往希望与其他机构比较绩效。因此,补充计量的数据和方法不可避免地会因为不同的用途而采用不同的策略。在这种情况下,应该是根据自身需求确定想要跟踪的影响或者参与情况,并选择不同的工具和数据。

    (2)应该使用什么数据源?

    底层的数据应该来自哪里是补充计量所要面对的另一个关键的挑战。通常,不同类型的影响需要不同数据源的数据来衡量。例如,为了测量对政策的影响,需要查阅政府文档;为了研究工作如何影响从业者,可能需要监控他们聚集的在线社区;为了看公共宣传是否成功,需要查看Twitter和Facebook。每一个目前可用的补充计量工具测量的都是不同的,但又有重叠的数据源。这种多样性设定是出于对实际情况的考虑,因为不同的数据源有不同的许可条款、馆藏主题以及与其相关联的风险问题。此外,一个数据源的在线关注度可以用很多不同的方法来衡量。若要更容易地对来自不同补充计量工具的数据进行合并和匹配,需要开发一些标准。然而,到目前为止,标准的开发是落后于工具的。

     (3)如何确定研究成果是受关注的?

    一旦确定了数据源,补充计量工具需要能够描绘出具体的研究成果的受关注情况。目前的工具通常是通过文章或是一些人工产品如数据库和幻灯片中的链接来跟踪关注情况,将这些链接解析成一个独一无二的标识符,如DOI、PubMed ID或是Handle。对链接的依赖是一个日益迫切需要解决的问题。虽然大部分的微博博主、科学博客博主,以及数字原生的新闻媒体都努力地在文章中加入链接,然而,传统的新闻媒体却没有这样的标准,因此,很多科学、医学和技术的新闻报道没有为其中所提及的研究文章添加链接。

    (4)如何去重?

    有时候,同一篇文章的不同版本会以不同的标识符出现在不同的在线站点上。例如,PubMed Central上的一篇文章有一个PubMed Central ID,而这篇文章在其出版商的网站上又有一个DOI,如何将两者合并去重是一个比较复杂的问题。这一问题导致补充计量统计过于分散,常常统计同一个研究成果的不同版本,而终端用户却很少关心这个问题。因此,补充计量工具需要维护不同版本标识符之间的映射关系,或是尝试对书目元数据和文献数据库中的文章进行自动匹配。

    (5)如何解读数据?

    经常使用社交媒介和博客讨论科研的学者不断增多,这意味着补充计量所统计的文章关注数据也在增多。随着时间的推移,这些丰富的数据将变得无比珍贵。随着技术的日新月异,学术交流以及出版界的不断变化,补充计量工具开发者需要留意所收集的指标的相关性。基于那些可能在未来已不再相关的数据源所构建的指标是危险的。换句话说,现在被认为“重要”的指标可能在未来变得不再如此重要。

    在开发补充计量工具时,必须考虑几个重要的问题:定义指标、改进测量能力、为后续的数据解读提供上下文细节信息。补充计量工具开发者需要足够灵活,以适应不同社区的要求,同时还能引导人们进行最佳实践。

    当然,仍然有人对补充计量的作用持怀疑态度。我们相信,随着研究数据对补充计量是一个有用的影响力测量方法的进一步证明,可用工具的出现将会有力推动补充计量的广泛采用。同时,社区参与的增加又将为工具开发者提供关键问题的解决思路。

    (编译自:http://onlinelibrary.wiley.com/doi/10.1002/bult.2013.1720390410/pdf)

发布时间: 2014-01-08   浏览: 392
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn