通常认为, 地理距离较近的科研人员之间的相互影响比距离较远的科研人员之间的相互影响要大。然而, 随着网络的出现与应用, 有学者认为远程通讯技术和计算机网络的关键意义是使地理空间邻近变得不太重要了, “网络使距离消失, 世界变成平的”[ 1]。对于不同地域间科研人员的合作倾向, 虽然有人认为“人类喜欢聚居, 而科学研究则没有这个倾向”, 但Hoekman等[ 2]通过研究得出了相反的结果。他们以欧洲33个国家的313个地区在2000年-2007年公开发表的论文为分析数据, 研究发现地理距离对欧洲的科学合作有较大影响, 距离越短则合作越密切, 距离越长则合作越稀疏。另外, 英国学者Katz[ 3]分别以加拿大、澳大利亚和英国的大学为样本集, 以绝对合作频次为指标考察大学校际合作的地域倾向, 发现一个国家内部大学间的合作频次随着大学之间地理距离的增大呈指数型降低。Lee等[ 4]对论文合作者之间的物理距离和合作论文的影响力 (用被引次数反映) 之间的关系进行了研究, 发现学者办公室之间地理距离越近, 他们的合作论文就越多, 且第一作者与最后一位作者之间的距离同合作文章的影响力高度相关。
Haustein等[ 5]以亚太地区11个国家10年间多个学科的合作论文数据为样本, 对国际间科学合作的原因进行了分析, 认为科学生产力是影响科学合作的重要因素, 并用Salton指数测度了不同国家间的合作强度, 特别指出中国的国际论文合作在快速增长。Huamaní等[ 6]利用10年数据分析了拉丁美洲的科学生产力分布特征以及拉丁美洲各国家间的科学合作情况, 发现虽然巴西的科学生产力很高, 但其国际科学合作却处于一个较低的水平。另外, Archambault等[ 7]就不同地区、不同规模的科学合作如何比较计算进行了讨论和分析。
我国学者梁立明等[ 8]对欧盟15国任意两国之间的合作发表论文进行计量分析发现, 地理邻近是影响欧盟15国科学合作的重要因素, 15国间的科学合作强度随地理距离和语言差异度的增大而降低, 呈负指数分布。梁立明等[ 9]对中国科学引文数据库 (CSCD) 中异省区作者共同署名论文的计量分析显示, 地理邻近是决定我国跨省区科学合作的重要因素, 省区间的合作强度随省区间直线距离的增大而降低, 呈负幂分布, 最密切合作省区中接壤省区的几率高达80%。梁立明等[ 10]的另外一项研究发现, 我国的跨省区科学合作存在马太效应和地域倾向;他们还发现, 我国34所985高校校际科学合作亦存在强地域倾向[ 11]。孙海生[ 12]以CNKI数据库为样本, 采用文献计量和社会网络分析方法, 对图书情报研究机构之间的合作状况进行研究, 结果表明, 国内图书情报研究机构之间的合作呈现明显的地域特征。
在研究科学合作空间结构时, Isard[ 13]早在1954年就采用了类似于牛顿定律——万有引力定律的模型。在进行科学合作地域倾向研究时, 主要应用的就是此模型, 或者此模型的引申模型, 如Ponds等[ 14]在2007年利用该模型计算了荷兰国内各省之间的科学合作强度, Hoekman等[ 15]在2009年采用此方法分析了欧洲的科学合作生产力情况。梁立明等[ 9]在2002年采用Salton模型[ 16]进行了我国科学合作地域倾向研究, 本文亦采用此模型。
这些研究主要是基于国外数据库的以自然科学为研究对象的研究结果。那么, 在当今网络环境下, 我国的人文社会科学合作是否存在地域倾向性?如果其地域倾向性确实存在, 那么哪些地域之间更易进行科学合作, 倾向程度到底如何?地理距离又是如何影响我国的人文社会科学合作的?经济学是人文社会科学中较大的学科, 较有代表性, 本文从我国经济学领域期刊论文的联合署名出发, 对我国各省市间的人文社会科学的合作倾向进行分析。
科学合作有多种形式, 如联合承担项目、合作推广成果、合著发表论文等。期刊论文具有出版快、专业性强的特点, 能够及时反映学科领域的最新研究成果和进展, 是科研产出的重要表现形式, 也是诸多学者研究科学合作时的常用测度指标[ 17]。鉴于此, 笔者从期刊论文的联合署名出发, 对我国地区间的人文社会科学合作倾向进行分析。本文以“中国知网”为检索源, 以经济学学科为统计样本, 以北京大学图书馆编制的《中文核心期刊要目总览 (2011版) 》为期刊筛选依据, 选择经济学领域中的150种核心期刊为来源期刊, 获取其2003年-2012年共10年的期刊论文数据, 约27万篇论文, 其中合著论文约9.2万篇, 检索时间为2013年2月。统计合著论文中各署名单位所处的地区后, 进行我国人文社会科学合作地域倾向分析。
本文仅以我国大陆的31个省、直辖市、自治区 (简称地区) 为统计样本, 未将我国的台湾省、香港特别行政区、澳门特别行政区纳入样本数据范围。数据清洗整理后, 我国31个地区的科学合作情况如表1所示:
(注:I:论文总数;II:独著论文数;III:合作论文数=V+VI=I-II;IV:合作率=III/I;V:地区内合作论文数;VI:主动合作论文数 (以第一作者身份与其他地区合作) ;VII= VI/III;VIII:主动地区合作频次 (以第一作者身份与其他地区合作) ;IX:被动合作频次 (以第二及以后排序作者身份与其他地区合作) ;X:总合作频次= VIII + IX。)
表2中左边一列是主动合作的地区, 即以第一作者身份进行科学合作的地区;上方行是被动合作的地区, 即以第二及以后排序作者身份进行科学合作的地区。由于本研究不计量各地区内的合作, 对角线元素空缺。地区顺序以该地区合作论文数 (表1中第III列) 降序排序, 后面的矩阵也以此顺序排列, 表2中所有地区的主动合作频次为42 041次。
需要注意的是, 表1中主动合作频次大于等于主动合作论文数, 例如一篇论文由北京、上海、江苏联合署名, 则北京的主动省际合作频次为“2”, 主动合作论文数为“1”。
我国31个地区科学合作频次的观察值矩阵如表2所示:
为方便统计分析, 根据表2矩阵A构造表3矩阵A*, 即不考虑科学合作的主动与被动, 以总合作频次构造矩阵A*, 如表3所示。为节省版面, 表3及后继矩阵表中均仅列出前10位。
(1) 地区间合作倾向值计算
数学期望是最基本的数学特征之一, 它反映随机变量平均取值的大小, 又称期望[ 17]。两个地区合作频次的期望值表征的是两个地区理论上可能发生的合作频次。合作倾向值是观察值与期望值的比值, 比值越大, 合作倾向越大, 反之则小。
①期望值计算方法。离散型随机变量的数学期望计算公式[ 18]如下所示:
笔者根据公式 (1) 计算期望值。本文期望值的计算是以观察值为基础的, 据观察值矩阵的数据特征, 可采用以下公式计算期望值。
其中, Xij表示与观察值矩阵元素xij对应的期望值矩阵元素, xi表示观察值矩阵中第i行数值之和, yj表示观察值矩阵中第j列数值之和, T表示观察值矩阵数值的总和。期望值矩阵所有元素之和等于观察值矩阵所有元素之和。计算我国31个地区的科学合作频次期望值矩阵B如表4所示:
②合作倾向值计算方法。合作倾向值=观察值/期望值。令rij=xijXij (i≠j) , rij是观察值与期望值的比值。当rij>1时, 观察值大于期望值, i和j倾向合作;rij越大, 合作倾向越强;rij<1, 合作倾向性差。然后构建合作倾向值矩阵, 即观察值与期望值比值矩阵, 该矩阵中的值称为合作倾向值。计算我国31个地区的主被动合作频次合作倾向值矩阵R如表5所示:
(2) 地区间合作强度计算
合作强度是表征科学合作倾向性的计量指标, 有不同的合作强度计算公式, 本文选用改进的Salton指数[ 15]测度科学合作强度。合作强度计算公式如下:
其中, nij表示i地区与j地区的绝对合作频次;ci和cj分别表示地区i和地区j在样本集内的总合作频次。两地区合作强度Salton指数越大, 合作倾向越强, 由此可计算我国31个地区的两两合作强度。每个地区的平均合作强度计算方法如下所示:
其中, mi为i地区的平均合作强度。
(1) 科学合作论文主要分布在我国东、中部地区
根据表1中的“合作论文数”数据 (见表1第III列) , 采用GeoDa软件[ 19]绘制我国31个地区的科学合作论文地域分布情况, 如图1所示:
图1中颜色越深则该地区合作论文数越多。可知, 合作论文主要集中在我国的东部和中部地区。我国31个地区的平均合作论文数是2 785.22, 超过平均数的地区有12个, 即有19个地区低于平均水平。北京位列第1, 显示颜色最深, 是合作论文数最多的地区, 发表超过1万篇合作论文;江苏、上海、湖北分列第2、3、4位, 显示颜色次深, 每个地区发表超过6 000篇合作论文;广东、四川、辽宁、陕西、浙江、天津、湖南和山东分列第5至第12位, 显示颜色较深, 每个地区发表合作论文数亦超过平均值。
(2) 各地区科学合作论文数排序情况与10年前自然科学相似
在表1中, 我国的31个地区被分成3组, 第1组是科研生产力前10名的地区, 第2组是第11至第20名的地区, 第3组是第21至第31名的地区。这3组分别代表高、中、低三种不同科研生产力地区。从表1可以看出, 无论是论文数、独著论文数、地区内合作论文数、还是合作论文数, 都相对集中在第1组中, 如第1组的论文数是188 985, 占整个论文数的70.02%, 独著论文数是123 181, 占整个独著论文数的69.21%, 地区内合作论文数是34 166, 占整个地区内合作论文数的74.83%, 合作论文数为65 804, 占整个合作论文数的71.59%。这与梁立明等[ 9]2002年的研究结果基本相似, 比例亦基本相同, 其研究结果是, 第1组地区论文数占整个论文数的70.88%, 合作论文数占整个合作论文数的71.36%, 这说明第1组的实力变化不大。需要注意的是, 第1组10个地区的构成也与10年前相比相差不大, 现在的顺序是北京、江苏、上海、湖北、广东、四川、辽宁、陕西、浙江和天津, 梁立明等[ 9]10年前自然科学的研究结果是北京、上海、江苏、广东、湖北、陕西、山东、四川、辽宁和浙江, 仅山东跌出前10名, 天津进入前10名, 其他地区名次略有上下浮动。
(3) 各地区科学合作论文率排序情况与10年前自然科学相反
随着时间的推移, 我国科学合作情况越来越多, 论文合作率从2003年的33.94%上升到2012年的53.06%, 2004年-2011年的合作率分别是36.43%、39.42%、41.99%、45.21%、47.01%、48.36%、49.84%和52.31%。从平均合作率看, 我国31个地区的平均合作率是34.06% (见表1第IV列) , 第1组地区的合作率是34.82%, 第2、3组地区的合作率分别是32.85%和29.95%, 由此可见, 科学合作率随着科研生产力的降低而降低。这与10年前梁立明等[ 9]的自然科学研究结果正好相反。从主被动科学合作率来看, 我国31个地区的主动平均合作率是50.33% (见表1第VII列) , 第1组地区的主动合作率是48.08%, 第2、3组地区的主动合作率分别是55.27%和59.16%, 主动科学合作率随着科研生产力的降低而升高。由此推断, 我国科学合作情况已经有所变化, 高科研生产力地区更注重省际间的科学合作, 但是低科研生产力地区在科学合作中更加主动。
科研生产力对科学合作地域倾向的影响分析分为三部分:以科研生产力最高的北京为例, 对主动与被动合作倾向进行分析;按科研生产力强弱进行分组, 对不同级别组之间的科学合作倾向进行分析;分析科研生产力与科学合作强度的关系。本文以论文数作为科研生产力指标, 发表论文多则科研生产力高, 反之则低。
(1) 北京与其他地区的科学合作倾向
北京在我国科学合作中扮演重要角色, 它是科研生产力最高的地区, 合作论文总数为18 369, 占整体合作论文总数的19.98%;主动合作论文数最高 (8 381) , 占整体主动省际合作论文总数的18.12%;合作频次最高 (15 010) , 占整体合作频次的17.85%。鉴于此, 首先对北京与其他地区的科学合作倾向进行分析。北京与科研生产力不同级别组之间的观察值、期望值和合作倾向值如表6所示:
表6北京与科研生产力不同级别组的观察值期望值与合作倾向值
从北京与科研生产力不同级别组的合作倾向看, 北京主动与高科研生产力地区 (第1组, 地区2-10) 合作4 561次, 与中科研生产力地区 (第2组, 地区11-20) 和低科研生产力地区 (第3组, 地区21-31) 的合作频次分别是2 396和707, 合作频次随着科研生产力的降低而降低。从合作倾向值看, 北京与高科研生产力地区的合作倾向值是1.69, 与中、低科研生产力地区的合作倾向值则分别是1.04和0.94。由此可见, 北京的主动合作倾向随着地区科研生产力的降低而降低, 即北京更倾向与高科研生产力地区合作, 呈现“北京-高”倾向。这与10年前梁立明等[ 9]的研究结果恰好相反, 再一次表明这10年间我国的科学合作地域倾向发生了变化。
从科研生产力不同级别组与北京的合作倾向看, 高、中、低科研生产力地区主动与北京合作的频次分别是4 436、2 290和620, 这均低于北京与他们主动合作的频次, 北京在合作中的表现更加主动。高、中、低科研生产力地区主动与北京合作的倾向值分别是1.55、1.20和0.95, 由此可知, 高科研生产力地区与北京的合作倾向值最高, 呈现“高-北京”倾向, 但也要注意到这比北京与高科研生产力地区的合作倾向要低, 中、低科研生产力地区与北京的合作倾向却比北京与他们的倾向要高。
(2) 不同级别组地区之间的科学合作倾向
下面将北京放入第1组中, 进行不同级别组之间的合作倾向分析, 合作倾向值如表7所示:
由表7可以看出, 第1组高科研生产力地区最倾向与第2组中科研生产力地区合作 (合作倾向值为1.11) , 呈现“高-中”倾向;第2组最倾向与第1组合作 (合作倾向值为1.11) , 呈现“中-高”倾向;第3组低科研生产力地区最倾向与第1组合作 (合作倾向值为1.08) , 呈现“低-高”倾向。
从以上分析可知, 我国科学合作地域倾向呈现强强联合之势, 不仅高科研生产力地区更愿意与高科研生产力地区合作, 而且中、低科研生产力地区也最愿意与高科研生产力地区合作。
(3) 地区科研生产力与科学合作强度
采用表3中的数据, 根据公式 (2) 和公式 (3) 计算我国31个地区的合作强度后, 采用Ucinet软件绘制我国31个地区之间的合作强度网络, 如图2所示:
(Sij>0.05)
图2中地区间连线的粗细表示地区间合作强度的大小, 强度指标为Salton指数, 构建合作强度网络的临界值是0.05。如果两个地区之间的合作强度小于临界值0.05, 在图2中则不予显示。可以清晰看出, 我国31个地区中, 北京与江苏的合作强度最大 (0.326) , 处于领先位置;北京与湖北 (0.229) 、上海 (0.228) 两个地区的合作强度处于第2梯队;由于与所有地区的合作强度均小于临界值 (0.05) , 青海、西藏、宁夏、广西、海南、贵州6个地区在图2中成为孤立点;其他地区的合作强度处于第3梯队, 其中北京与24个地区的合作强度大于临界值, 江苏与14个地区的合作强度大于临界值, 上海13个, 湖北12个, 广东、四川和辽宁分别有10个。
为探索科研生产力与科学合作强度之间的关系, 结合表1中的数据, 利用SPSS软件的回归分析对我国31个地区的合作论文数与合作强度、合作频次与合作强度的关系进行曲线拟合, 如图3所示:
从图3可以清晰地看出, 合作论文数、合作频次与合作强度的关系用幂函数拟合效果较好 (除去北京一个孤立点) 。其中, 合作论文数与合作强度的回归方程是:y=0.0046×x0.52, 统计检验值R2=0.985;合作频次与合作强度的回归方程是:y=0.0028×x0.58, 统计检验值R2=0.986。这表明, 我国31个地区的科研生产力与合作强度成正相关关系, 随着合作论文数、合作频次的增大, 合作强度在不断增长。需要注意的是, 图3 (a) 和图3 (b) 中均有一个明显的孤立点, 此孤立点是北京。由此推断, 科学合作不仅仅受科研生产力的影响, 也与其他影响因素有关。
(1) 地区间地理距离与科学合作倾向值
为讨论地理距离与科学合作倾向值的关系, 本文采用两种距离分组方法进行分析 (将两地区省会之间的直线距离记做两地区间的地理距离) :
①样本顺序分组。将我国31个地区的两两地理距离 (共465个) 按升序排序, 按照40个一组进行分组, 最后一组为25个, 将我国31个地区的两两地理距离划分为12个组, 每组的距离取40 (25) 个距离的平均值;根据距离分组计算每组的平均合作倾向值;建立合作倾向值与地理距离的对应关系, 利用SPSS软件进行曲线拟合, 如图4(a) 所示。
②定长距离分组。我国31个地区间的最长距离是3 558.08km, 最短距离是103.61km, 两者差是3 454.47km;将3 454.47km分成12等分, 将31个地区的两两距离 (共465个) 划分成12组, 第1组 (103.61km-391.48km) , 第2组 (391.48km-679.35km) , …, 第12组 (3 270.18km-3 558.08km) ;计算每组对应的平均合作倾向值;建立合作倾向值与地理距离的对应关系, 利用SPSS软件进行曲线拟合, 如图4 (b) 所示:
从图4可以看出, 地理距离与合作倾向呈负相关关系, 随着地理距离的逐渐增加, 合作倾向逐渐减小。按照样本顺序分组后, 将地理距离与合作倾向值进行曲线拟合, 三次方函数拟合效果较好, 曲线方程是y=1.09-0.007x+2.99e-7x2-4.13e-11x3, 检验值R2=0.967;按照定长距离分组后, 同样是三次方函数拟合效果较好, 曲线方程是y=1.15-0.008x+3.31e-7x2-4.35e-11x3, 检验值R2=0.921。
(2) 地区间地理距离与科学合作强度
讨论地理距离与合作强度之间关系与讨论地理距离与合作倾向值之间关系的方法相似, 仍然采用两种距离分组方法进行分析, 利用SPSS软件进行曲线拟合, 如图5所示:
从图5可以看出, 地理距离与合作强度同样呈负相关关系, 随着地理距离的逐渐增加, 合作强度逐渐减小。按照样本顺序分组后, 将地理距离与合作强度进行曲线拟合, 指数函数拟合效果较好, 曲线方程是y=0.06×e-0.0006x, 检验值R2=0.952;按照定长距离分组后, 同样是指数函数拟合效果较好, 并且与样本顺序分组的曲线方程相同, 曲线方程是y=0.06×e-0.0006x, 检验值R2=0.939。
由以上分析可知, 在我国31个地区的科学合作中, 随着地理距离的加大, 地区间科学合作频次、合作倾向与合作强度均呈现下降趋势。由此推断, 地理距离是影响科学合作的一个重要影响因素。但是也要看到, 地理距离对科学合作的影响并不是绝对的, 比如北京与江苏两者之间的地理距离是900.19km, 在北京与其他30个地区地理距离排序中位列第9, 但北京与江苏的合作频次 (1 594) 、合作期望 (2.8) 、合作强度 (0.326) 是两两地区间最大的。另外, 北京与湖北、上海、辽宁等地区的科学合作情况跟北京与江苏类似, 科学合作受地理距离影响不明显。这可能与北京是我国的首都, 是我国的政治、文化、经济中心有关。
通过本文分析可知, 我国的人文社会科学合作确实存在地域倾向。科学合作的地域倾向大小与科研生产力呈正相关关系, 并呈现强强联合之势, 无论是高科研生产力地区, 还是中、低科研生产力地区都愿意与高科研生产力地区合作。人文社会科学合作的地域倾向大小与地理距离则呈负相关关系, 地区间地理距离越长, 科学合作强度越小。当然, 我国人文社会科学合作地域倾向的出现是各种因素共同作用的结果, 本文仅对科研生产力与地理距离的影响进行了单独分析, 后继研究中需要考虑各种因素的综合影响。