科学计量学的发展与布局:1978-2008
陈云伟
中国科学院国家科学图书馆成都分馆 成都 610041
摘要

采用科学计量学的方法,基于Scientometrics期刊,对其收录的1978-2008年的2 461篇论文进行科学计量分析,研究世界科学计量学的国家、机构和主题布局。通过时间序列趋势图、列表和矩阵图等手段描述科学计量学的国家布局,分析论文数在20篇以上的机构分布情况,利用关键词分析科学计量学研究的主题分布,主要分析工具包括TDA和Excel。

关键词: SCI; 科学计量学; 计量分析
Trend Mapping of Scientometrics Development: 1978-2008
Chen Yunwei
The Chengdu Branch of National Science Library, Chinese Academy of Sciences, Chengdu 610041, China
Abstract

This article makes an analysis of 2 461 papers published in the journal Scientometrics during 1978-2008. By means of scientometric methods and tools (TDA and Excel), the article presents the development trend of scientometrics, and maps the distributions of (the research-related) countries with charts for comparison and collaborations matrix. Then it analyzes 31 top institutions whose number of papers is not less than 20 and reveals the subject areas based on keywords.

Keyword: SCI; Scientometrics; Bibliometric analysis
1 引 言

科学计量学是由基于引文分析的领域可视化研究领域派生出来的新学科,采用文献计量学手段分析科学文献,对科技交流进行数量级的研究[ 1]。通过特殊的方法,科学计量学已经广泛地应用于评价科学进步与科学家行为的研究中。经过数十年的发展[ 2],科学计量学以大规模的学术数据库为基础,利用文献、专利、基金等信息作为重要的工具描绘大量学科领域的发展和当今的科学技术,已经取得了大量的成就。例如,Börner[ 3]利用科学计量学方法进行了科学结构与演进分析;Boyack、Börner和Klavans[ 4]以SCIE和SSCI为数据基础,采用科学计量学方法分析了过去30年间化学研究的结构和演进;Leydesdorff和 Rafols[ 5]基于ISI学科分类在全球层面上对科学发展进行研究;陈云伟等[ 6]对SSCI收录的情报学与图书馆学期刊论文进行科学计量学分析,展示了国际图书情报近年的发展情况。

与此同时,OECD、美国NSF和NIH等组织机构也纷纷基于发明专利数据或论文,利用科学计量学方法评估国家、地区或机构在不同水平的技术创新能力[ 7]。例如,OECD开发了面向专利家族、引文分析的新指标体系,用于描绘国家、地区或特定领域和技术主题的创新技能和技术进步[ 8];IpIQ公司帮助美国NSF出版《科学与工程指标索引》,其中对专利数据进行了系统的科学计量学分析[ 9];同时,NSF[ 4]和NIH[ 3]也资助了一些科学计量学家开展科学计量学研究工作。

随着科学计量学在图书情报研究中的地位越来越高,目前已有几项基于SCI期刊Scientometrics研究科学计量学的研究工作。例如,Schoepflin和Glanzel[ 10]基于1980、1989和1997年Scientometrics期刊的文章分析发现,与科学政策和科学社会学研究相关的论文比例呈现下降趋势;Peritz和Bar-Ilan[ 11]通过分析Scientometrics期刊1990年和2000年的文章发现,研究政策和科学的社会学研究在Scientometrics期刊论文的参考文献中分列第3位和第4位;Chen、McCain和White等[ 12]利用Scientometrics期刊1981-2001年间的论文数据进行引文和共引图谱分析;Hou、Kretschmer和Liu[ 13]利用Scientometrics期刊1978-2004年的文献数据在微观水平(个人)研究了科学计量学的科技合作网络;Dutt、Garg和Bali[ 14]分析了Scientometrics期刊1978-2001年间的论文,对科学计量学在国家和主题的分布进行了评估,比较了机构和作者合作关系。

目前,尚没有针对科学计量学发展和学科布局结构进行全景分析的工作,本文在全球总体水平上,利用科学计量学方法分析科学计量学过去31年的发展及学科布局。选取Scientometrics期刊载文作为分析科学计量学发展和布局的数据基础主要基于以下原因:

(1)Price[ 15]认为期刊是合适的分析单元;

(2)Scientometrics期刊是科学计量学领域的旗舰刊物[ 12],在JCR公布的2007年影响因子中,该刊物在所有情报学和图书馆学刊物中排名第二[ 16];

(3)根据Judit[ 17]和Wilson[ 18]的研究结果,Scientometrics期刊是计量情报学领域最常见的期刊。

因此,本文主要利用科学计量学方法、基于1978-2008年Scientometrics期刊载文对科学计量学的发展和布局进行引导性研究,以期为国内科学计量学研究提供有价值的引导和参考信息。同时也通过国家、机构和个人的比较分析,发现我国在科学计量学领域的研究现状、与国际的合作关系及所处地位等。

2 科学计量学发展与布局分析
2.1 研究方法

选取Scientometrics期刊1978-2008年所有类型载文作为数据源,通过Web of Science网络数据库检索共获得文献2 461篇,具体研究方法如下:

(1)在Web of Science网络数据库中采用期刊名称(SO=Scientometrics)和发表年(PY=1978-2008)组合检索,获取1978-2008年文献数量;

(2)通过在线分析获得图书情报学科的论文数量年度布局、国家(地区)(Country/Territory)布局以及机构(Institution)布局等基础数据;

(3)采用TDA(Thomson Data Analyzer)和Excel等分析工具对数据进行深加工,根据数据分析结果,结合文献调研对结果进行评价与分析。数据下载时间为2009年3月5日,在线分析时间为2009年6月。

2.2 年度发展趋势分析

截至2009年3月5日,在Web of Science网络数据库中,收录Scientometrics期刊在1978-2008年总计文献数量2 461篇。年度变化趋势统计如图1所示,年均增长率16.6%,此数据将作为评价国家或机构年度增长的参考依据。单个期刊载文数量的变化虽然不能直接代表某学科论文产出的总体变化情况,但鉴于Scientometrics期刊在科学计量学领域的重要地位,该刊载文的逐年递增至少可以说明在科学计量学领域的产出呈现逐年递增的趋势。

图1 Scientometrics期刊年度载文量变化趋势图

2.3 国家(地区)布局

1978-2008年,Scientometrics期刊收录的2 461篇论文来自60个国家(地区)。其中数量最多的是美国,总计有166篇论文,占论文总数的6.7%,比利时、荷兰、印度、西班牙、德国、英国、法国、匈牙利和中国分列2-10位。与情报学与图书馆学论文分布格局[ 6]不同,在科学计量学领域论文产出上,全球分布相对较为分散,前10个国家之间的总数差距并不大,未出现美国在情报学与图书馆学研究优势极为突出的现象(美国占情报学与图书馆学领域论文数的59.1%[ 6])。表1列出了排在前10位的国家(地区)。在前10位国家和地区中,在最近10年里,除中国在2000年没有论文产出外,其他国家每年都有论文产出。为了方便计算最近10年的年增长率,避免个别年份的较大波动对增长率计算的负面影响,对数据进行了适当修正,中国在2000年的数据由0修正为2,德国在2001年的数据由20修正为2。修正后的数据经计算获得前10位国家1999-2008年的平均年增长率,如表2所示。在过去的10年里,中国在科学计量学研究方面保持了最高的年均增长率,达到41.6%,其次是西班牙和美国,年均增长率分别为40.1%和29.4%。近年来我国越来越多的机构开始关注在科学计量学领域的研究工作,如哈尔滨理工大学、北京大学、河南师范大学、中国科学院国家科学图书馆、清华大学、中国科技情报研究所、武汉理工大学、浙江大学、上海交通大学和大连理工大学等。

虽然印度在论文总数上仍处于全球第4的位置,但是在1999-2008这10年内,其年均增长率为-9.9%;在Scientometrics期刊载文年均增长16.6%的情况下,印度的发文量却呈现逐年递减的趋势,此问题值得关注。为了找出这种现象的原因,对印度在Scientometrics期刊发文的所有机构从1998年以后的发文量分析发现,印度国立科技与发展研究所(National Institute of Science,Technology and Development Studies)从1999年后论文数量的逐年减少直接导致了印度在Scientometrics发文的负增长。印度国立科技与发展研究所在Scientometrics期刊的发文量占印度全国在该刊发文量的50%,然而,10年的时间,该研究所的发文量从1999年9篇,下降到2006和2007年各1篇,2008年0篇,其他各年呈现出逐年递减的态势。为了弄清是印度在科学计量学研究方面产出减少,还是其有关科学计量学的文章被分流到其他刊物,本文比较分析了印度国立科技与发展研究所1999-2008年在Web of Science的发文变化情况发现,该研究所在1999-2008年总计发文161篇,其中1999-2002各年发文量在20篇以上, 2002-2005各年发文量则下降到12-15篇之间,2006年仅3篇,2007年11篇,2008年8篇。该研究所的文章主要发表在Scientometrics、Current Science和Journal of Scientific & Industrial Research上,分别为46、29和23篇,其中在Current Science未见明显的论文年度增长变化,而在Journal of Scientific & Industrial Research也出现发文量逐年递减的态势。可见,印度在Scientometrics期刊发文量的负增长现象并非由文章被分流到其他刊物所致,根本原因在于印度本国相关研究所的Web of Science数据库中论文产出数量出现了逐年减少的态势。

表1 Scientometrics载文国家(地区)布局

表1可知,比利时的合作频次表现最为活跃,共有97篇次合作论文,然而其合作国家数仅为14,明显弱于荷兰(22)、英国(22)和美国(19),但这三个国家的合作频次明显弱于比利时(97),分别为52、66和44。为了描述各国合作相对强度的大小,设计了相对合作强度(Relative Collaboration Intensity,RCI)的概念,前10个国家的平均合作国家数、平均合作频次以及RCI通过下面公式计算获得:

平均合作国家数: (1)

平均合作频次: (2)

(3)

其中,i∈[1,10],代表前10名国家,CCi代表某国合作国家数,CTi代表某国合作频次。

通过表1的RCI列的数据发现,比利时拥有最高的相对合作强度,其次为英国、荷兰和美国。表2列举了论文数在20篇以上的国家(地区)详细的合作关系矩阵,可见,比利时的主要合作国家(地区)包括英国、匈牙利、芬兰、中国、印度与荷兰,英国是美国的最主要合作国,然而,比利时和芬兰是英国最主要的两个合作国,中国的主要合作国则是比利时和德国,分别有11篇和6篇合作论文。中国与比利时合作的11篇论文中,主要是中国的河南师范大学、中国科学院国家科学图书馆、大连理工大学以及中国科学技术信息研究所与比利时的天主教鲁汶大学、安特卫普大学、安特卫普研究大学之间的合作。与德国合作的6篇论文有4篇来自河南师范大学的梁立明教授,另外两篇是大连理工大学与德国COLLNET中心合作的文章。数据表明,以梁立明教授为代表的河南师范大学为我国科学计量学的国际合作研究做出了突出的贡献,其他机构还包括大连理工大学、中国科学院国家科学图书馆和中国科学技术信息研究所等。

表2 国家(地区)合作矩阵(论文数 ≥20)

需要说明的是,此处的合作矩阵仅代表有无合作关系,无法体现合作国家在单篇论文中的贡献强度,以后的研究中将深入分析作者的顺序关系,并基于单篇文章作者数量的多少赋予不同顺次作者一定的权重值,更加客观地比较不同国家(地区)之间的合作关系,可以发现在国际合作论文中起到更大的主导作用的国家和处于从属地位的国家。

图2 论文数与被引次数关系图

图2清晰显示了前10名国家形成了在科学计量学研究方面的优势集团,后50名国家与前10名国家之间无论在论文数量还是被引数量上都存在较大差距。此外,从论文的篇均被引频次角度分析,图2表明比利时、荷兰、匈牙利、德国和英国的论文平均被引频次高于美国、西班牙、印度、法国和中国。被引次数最多的国家是荷兰,其次是匈牙利、比利时和美国。

2.4 机构布局

1978-2008年,Scientometrics期刊收录的2 461篇论文来自936家机构,其中论文数超过10篇的机构有31家,如表3所示:

表3 Scientometrics载文机构布局(论文数≥10)

论文数量在10篇以上的前31名机构中,印度国立科技与发展研究所以其58篇论文的总数居第一位,比利时天主教鲁汶大学、匈牙利科学院、荷兰莱顿大学、西班牙高等研究委员会分列2-5位。前31家机构中有5家来自比利时,法国4家、匈牙利3家、英国3家、荷兰2家、印度2家、西班牙2家、澳大利亚2家、美国、丹麦、德国、芬兰、巴西、瑞典、欧盟和以色列各1家。中国虽然在论文总数上占据第10位,但是没有特别突出的机构在论文数上超过10篇,数量最多的是河南师范大学,论文数量为9篇,排在第32位。分析发现,这9篇论文全部来自河南师范大学的梁立明教授及与他人合作的文章。这也反映出个体的学术贡献对所在机构的国际学术地位的贡献力度。

在科学计量学领域研究领先的机构所从事的研究工作的成就与进展、领域、方向、具体课题、主要工具与方法等的研究工作是一项系统的调研分析工作,对我国图书情报界、科学学研究等方面也有非常重要的参考借鉴价值。

2.5 研究主题布局

随着数字化、网络化信息技术的飞速发展,计算机技术为科学计量学的研究提供了更为广阔的空间,此部分将分析科学计量学论文主要的研究主题分布情况。基于这样一种假定前提:每一个研究领域都可以通过最重要的关键词列表加以描述,每个关键词可以认为是文章研究主题的一个指标,一个关键词出现的频次越多,说明该关键词所表征的研究主题被研究的更多或处于研究的更高水平。ISI总计为2 461篇论文添加了1 086个关键词(Web of Science数据库中标记为Keyword Plus字段),表4列出了出现频次超过30的所有关键词,本文称之为高频关键词。结果显示,科学计量学领域的文章主要关注有关科学问题、引文、指标、期刊、影响、科研业绩、出版物、科技、合作、模式、国家、创新、网络、信息、影响因子、模型、大学、知识、物理和生产力等主题。

表4 高频关键词布局表
3 结 语

从论文数量角度分析,美国、比利时、荷兰、西班牙、英国等10个国家已经在科学计量学研究领域形成了一个相对优势群体,来自这些国家的重要研究机构正越来越广泛地采用科学计量学方法评价科学进步、科学家行为、合作网络等,这些机构主要包括天主教鲁汶大学、匈牙利科学院、莱顿大学、印度国立科技与发展研究所、西班牙高等研究委员会等。从合作强度角度分析,比利时已经成为全球最大的科学计量学合作中心,其次是英国、荷兰和美国。

经过近年的发展,中国已经步入科学计量学研究的优势集团行列,尤其是我国拥有科学计量学论文数41.6%的高年均增长率。按此预期,中国的论文数量还将迅速增加,并很可能快速成为数量上领先的少数几个国家之一。与图书情报学科比较,个别国家(如美国)研究优势尤为明显的现象在科学计量学领域并不明显,这也意味着各国之间在科学计量学领域研究差距相对缩小,更加有利于中国科学计量学研究跟上国际研究水平,甚至走在国际研究的前沿。虽然从机构角度分析,中国尚没有任何一家机构在Scientometrics期刊上的发文量超过10篇,不过随着时间的推移以及我国学术机构在科学计量学领域研究的不断开展,基于年度发展趋势,可以预期在10年内必将会有数家机构能跻身科学计量学论文产出全球30强。与此同时,中国相关研究机构应进一步加强与美国、比利时等国家的合作,深入开展理论和应用研究,在关注科学问题、科研业绩、科技、合作、创新等众多自然科学和社会科学领域开展研究工作,加强科学计量学理论和方法研究,对计量学指标、算法、模型、网络分析、引文分析、知识流分析的理论和方法加以深入研究,尤其需要开发一些适用于分析我国科学数据的算法和工具。

收集和组织数据是科学家日常研究工作的开端,然而随着科学计量学的出现,科学家则同时又是科学计量学家分析研究的对象,他们的基金资助以及论文或专利等数据,为科学计量学家研究科学问题提供了数据基础。尤其在过去的10多年里,引文分析以及期刊影响因子分析迅速成为科学计量学分析中普遍应用的方法,为比较个人、机构和国家的科技产出提供了非常明确的量化指标。但是,仅靠量化的数据尚无法准确地比较不同个人、机构或国家之间的科学研究的实际强弱关系,还需要一个相对客观的参数来评价科学家或机构的生产力及影响力,这也是科学计量学发展过程中必须面对而且亟待解决的问题之一。

参考文献
[1] Börner K, Chen C M, Boyack K W. Visualizing Knowledge Domains[J]. Annual Review of Information Science & Technology, 2003: 37(5): 179-255. [本文引用:1]
[2] Rip A. Qualitative Conditions of Scientometrics: The New Challenges[J]. Scientometrics, 1997, 38(1): 7-26. [本文引用:1] [JCR: 2.133]
[3] Börner K. Mapping the Structure and Evolution of Science[R]. Bethesda: Symposium on Knowledge Discovery and Knowledge Management Tools at NIH Natcher Conference Center, 2006. [本文引用:2]
[4] Boyack K W, Börner K, Klavans R. Mapping the Structure and Evolution of Chemistry Research[J]. Scientometrics, 2009, 79(1): 45-60. [本文引用:2] [JCR: 2.133]
[5] Leydesdorff L, Rafols I. A Global Map of Science Based on the ISI Subject Categories[J]. Journal of the American Society for Information Science and Technology, 2009, 60(2): 348-362. [本文引用:1] [JCR: 2.005]
[6] 陈云伟, 方曙, 邓勇. 基于SSCI研究世界图书情报学科布局[J]. 情报杂志, 2008, 27(12): 95-97, 114. [本文引用:3]
[7] Chen Y W, Yang Z P, Fang S. A Comparative Study on the Biotechnology Patents of CAS[C]. In: Proceedings of the 12th International Conference on Scientometrics and Informetrics. Rio De Janeiro, Brasil: ISSI, 2009. [本文引用:1]
[8] OECD. OECD Work on Patent Statistics[R/OL]. [2009-03-13]. http://www.oecd.org/document/10/0,3343,en_2649_34451_1901066_1_1_1_1,00.html. [本文引用:1]
[9] Science and Engineering Indicators 2008[R/OL]. [2009-03-13]. http://www.ipiq.com/our_research/index.asp. [本文引用:1]
[10] Schoepflin U, Glanzel W. Two Decades of "Scientometrics"-An Interdisciplinary Field Represented by Its Leading Journal[J]. Scientometrics, 2001, 50(2): 301-312. [本文引用:1] [JCR: 2.133]
[11] Peritz B C, Bar-Ilan J. The Sources Used by Bibliometrics-Scientometrics as Reflected in References[J]. Scientometrics, 2002, 54(2): 269-284. [本文引用:1] [JCR: 2.133]
[12] Chen C M, McCain K, White H, et al. Mapping Scientometrics (1981 -2001)[C]. In: Proceedings of the 65th Asist Annual Meeting. Pennsylvania: ARIST, 2002: 25-34. [本文引用:2]
[13] Hou H Y, Kretschmer H, Liu Z Y. The Structure of Scientific Collaboration Networks in Scientometrics[J]. Scientometrics, 2008, 75(2): 189-202. [本文引用:1] [JCR: 2.133]
[14] Dutt B, Garg K C, Bali A. Scientometrics of the International Journal Scientometrics[J]. Scientometrics, 2003, 56(1): 81-93. [本文引用:1] [JCR: 2.133]
[15] Derek J de Solla Price. Networks of Scientific Papers[J]. Science, 1965, 149(3683): 510-515. [本文引用:1]
[16] ISI. Journal Citation Reports 2007[DB/OL]. [2009-03-20]. http://admin-apps.isiknowledge.com/JCR/JCR?SID=V2p87KiN6kFEo3gHCM7. [本文引用:1] [JCR: 0.915]
[17] Bar-Ilan J. Informetrics at the Beginning of the 21st Century-A Review[J]. Journal of Informetrics, 2008, 2(1): 1-52. [本文引用:1]
[18] Wilson C S. Informetrics[J]. Annual Review of Information Science & Technology, 1999, 34(1): 107-247. [本文引用:1]