学术期刊评价中关键指标的确定方法研究*
王灵芝1, 俞立平2
1宁波大学人文与传媒学院 宁波 315211
2宁波大学商学院 宁波 315211
摘要

提出一种确定关键指标的方法——关键系数。认为关键系数的确定方法一般只具有统计学性质;数据标准化方法与极值对关键系数会产生影响;关键指标有可能会影响权重的确定;关键指标确定方法在线性评价和非线性评价中均可以采用。

关键词: 学术期刊; 评价; 关键指标; 关键系数
中图分类号:G312
Study on Key Indicators Definition and Its Impact in the Evaluation of Academic Journals
Wang Lingzhi1, Yu Liping2
1Faculty of Liberal Arts and Communication, Ningbo University, Ningbo 315211, China
2School of Business, Ningbo University, Ningbo 315211, China
Abstract

This paper proposes a new key indicators definition method which is key ratio. The key ratio gives a field vision of statistics, and the data standardization method and maximum have impacts to key ratio. The key ratio may affect indictor weight, and the method of key ratio is suitable for linear and nonlinear evaluation method.

Keyword: Academic journal; Evaluation; Key indicator; Key ratio
1 引言

在学术期刊评价中,多指标综合评价是一种被广泛采用的方法,它能克服单指标评价提供信息相对不足的缺点,采用各种不同的指标更加全面地对期刊进行评价。尽管单指标评价技术发展很快,涌现出如H指数[ 1]、特征因子(Eigenfactor)[ 2]等信息含量较大的指标,但总体上,多指标综合评价的优势还是显而易见的,因而得到了较为广泛的应用。

多指标综合评价方法大致上可以分为两类:线性评价方法,其原理是采用一定的方法(如层次分析法、熵权法、离散系数法等)对各指标进行赋权,然后将标准化的指标值进行加权汇总;非线性评价方法,其原理各不相同,一般是采取运筹学、模糊数学、系统工程等方法进行评价,如主成分分析、TOPSIS、粗糙集、数据包络分析等。在线性评价中,权重设定的方法既有主观的,也有客观的,权重越大的指标越重要。在非线性评价中,由于几乎没有权重的概念,那么什么指标更为重要呢?俞立平[ 3]在期刊评价中,将以往的某一可信评价结果值作为因变量,评价指标作为自变量进行回归,然后将回归系数归一化后得到非线性评价各指标的模拟权重,同样可以作为衡量指标重要性的一种方法。也就是说,无论对于什么评价方法,权重都是有形无形存在的。

关键指标是影响评价结果得分的重要指标,它的单独得分在评价结果得分中所占的比重较大。确定评价的关键指标无论对评价者还是被评价者都具有十分重要的意义。对评价者而言,确定的关键指标,不仅可以反思权重设置的科学性与合理性,对评价方法重新进行审视,努力做到评价公平,而且有利于控制关键指标的数据采集质量。对被评价者而言,弄清关键指标,有利于采取有效措施弥补差距,促进自身水平的提高。进一步地,只有公众、评价者与被评价者对关键指标的共同关注,才能提高期刊评价指标选取的合理性和权重设定的科学性,使评价方法经受住考验,最终推动整个期刊学术水平的提高。

在科技评价中,现有的研究往往集中于权重设定方法讨论以及评价方法的选取领域。徐耀玲[ 4]讨论了指标设计的原则和方法,认为应该系统考虑关联指标的权重设定,对于区分度较低和信息可靠性较低的指标应该赋予较低权重。李华等[ 5]使用因子分析法,分析提高学报学术影响力的主要因子,发现载文量、基金论文比这两个指标是影响学报学术影响力的主要因子。李卓青等[ 6]采用类似离散系数法的方法,分析得出可以舍弃其他指标,单独采用即年指标、影响因子、基金论文比这三项指标为关键指标来进行评价。刘自远等[ 7]采用6种权数法计算指标权重,经对比、稳定性检验和合理性分析,发现因子分析权数法和层次分析权数法求得的权数评价结果具有稳定性、合理性,符合客观实际。

从目前的研究看,关于指标权重问题的研究,主要集中在权重设定的合理性研究、权重的比较研究等方面,在“可以根据权重来判断关键指标”这一点上已经取得了共识。但至少还有以下问题没有得到重视:

(1)影响关键指标的因素是否只有权重?还有没有其他因素?比如评价指标数据的分布特点对指标重要性有没有影响?

(2)在设定权重时,是否应该要考虑到其他因素对指标重要性的影响,从而避免某些指标的实际重要性被多次“放大”或“缩小”?

(3)评价对象和评价方法一旦确定,关键指标实际上就已经确定。那么,如何确定?即通过什么方法能够找到影响评价结果的最重要的指标?

(4)在选取评价方法时,是否需要考虑不同评价方法关键指标的差异?即对某些关键指标的强调,可以反过来影响方法的选择。

对于以上问题,尚缺乏深入的研究。本文讨论影响关键指标的因素,提出关键指标的确定方法,然后以中国科学技术信息研究所的期刊引证数据为例,说明在科技评价中关键指标确定的方法,并就相关问题进行讨论。

2 关键指标确定

根据关键指标的定义,权重在关键指标确定中占有十分重要的地位;均值是整个指标水平的高低,对总评价值影响较大;极值由于对标准化结果影响较大,继而会影响均值;离散系数会通过区分度影响到评价结果。因此,这4个指标是影响关键指标的重要因素,下面分别进行说明。

(1)权重W

权重的表现形式并不一样,在线性评价中,无论采用什么方法,权重是直接确定的。在非线性评价中,很多情况下其实用不到权重,比如采用因子分析或灰色关联评价,是没有权重的。如果想知道相关指标的权重,此时不妨将以往的可信评价结果作为因变量,评价指标作为自变量进行回归:

Y=a1X1+a2X2+…+anXn (1)

其中,Y为非线性评价结果,X1,X2…Xn为评价指标,a1,a2…an为回归系数,n为评价指标的个数。将回归系数进行归一化处理,得到权重W:

Wi=

(2)

其中,之所以要给ai取绝对值,是因为ai回归后可能有负值,这种情况最容易出现在指标相关度较高的情况下,因为存在多重共线性。

需要说明的是,对于评价结果只有排序而没有得分的评价方法,以上方法并不适用,可以将评价结果分类后采用多元选择模型进行处理,同样可以得到模拟权重。

(2)离散系数DC

离散系数是标准差除以均值的结果,离散系数越大,表示指标的数据波动越大,指标的区分度越好。如果某个指标的离散系数很小,说明不同评价对象水平相差不大,该指标对评价结果的影响就不大,重要性就相对降低。

(3)均值M

指标均值大小对指标在评价结果得分的比重也非常重要。均值一般是指标标准化后的结果,如果原始数据还没有标准化,均值比较是没有意义的,因而不具有可比性。

(4)极值系数 MR

极值系数包括极大值系数和极小值系数两种情况。对正向指标而言,要考虑极大值系数;对反向指标而言,要考虑极小值系数。

以极大值系数为例,极大值系数是极大值除以均值的结果。在进行标准化时,一般是用各评价对象的指标值除以极大值,如果极大值很大,会降低其他所有评价对象标准化后的结果,直接导致标准化后的均值降低,从而间接降低了该指标在评价中的重要性。

极值系数是反向指标,其值越大说明指标的重要性越低。为了修正这个问题,可以采用线性变换方法将其转为正向指标,俞立平等[ 8]认为,反向指标的标准化,只有采用线性变换才不会使数据失真,才是一种值得推广的反向指标数据标准化方法。

原极值系数的计算公式如下:

MR'=

(3)

经线性正向转化后极值系数为:

MR=1-

(4)
+

(5)关键指标确定的方法

由此可见,权重、均值、离散系数、极值系数都会影响评价指标的重要性,其中,权重是显性的,而均值、离散系数、极值系数都是隐性的。本质上,均值和极值系数的原理相近,属于同一类参数。将这4个参数标准化后,得到指标的关键系数确定公式:

K= ×100 (5)

由于4个参数的极大值经标准化后均为1,这样经过公式(5)处理后,指标的关键系数极大值为100,极小值依赖于数据。一旦评价方法确定,可以很容易地计算出不同指标的关键系数。

3 数据和实证研究结果
3.1 数据

本文数据来自于中国科学技术信息研究所CSTPC数据库,选取本科院校人文社会科学版学报为例进行分析。中国科学技术信息研究所从1987年开始对中国科技人员在国内外发表论文数量和被引情况进行统计分析,并利用统计数据建立了中国科技论文与引文数据库,同时出版《中国学术期刊引证报告》。2010年本科院校学报共有239种,剔除了其中16种部分数据不全的期刊。选取的指标有:总被引频次、影响因子、即年指标、他引率、引用刊数、学科影响指标、学科扩散指标、被引半衰期、H指数、平均引文数、机构分布数、基金论文比、引用半衰期共13个指标。

3.2 TOPSIS评价

本文采用非线性评价方法TOPSIS来说明关键指标的确定方法(也可以用其他非线性评价方法)。TOPSIS是Huang等[ 9]提出的一种优秀的评价方法,其基本思想是:通过归一化后的数据规范化矩阵,找出多个目标中最优目标和最劣目标(分别用理想解和反理想解表示),分别计算各评价目标与理想解和反理想解的距离,从而得到各目标与理想解的贴近度,贴近度取值在0-1之间,该值越接近1,表示相应的评价目标越接近最优水平;反之,该值越接近0,表示评价目标越接近最劣水平。

运用TOPSIS法的主要步骤如下:

(1)将决策矩阵标准化,得到标准化矩阵;

(2)确定标准化矩阵的理想解和负理想:

Y*={ , ,…, }

Y-={ , ,…, }

其中, , 分别表示第j个指标的理想解与负理想解,其计算步骤如下:

= ), )} (6)

= ), )} (7)

(3)计算各方案到理想解与负理想解的欧式距离:

= , i=1,2,…,m(8)

= , i=1,2,…,m(9)

(4)计算各方案的相对贴近度,得到评价结果:

= ×100 (10)

部分TOPSIS评价结果如表1所示。将评价结果作为因变量,标准化后的评价指标作为自变量进行回归,结果如表2所示。之所以选取标准化后的指标数

表1 部分TOPSIS评价结果(前30种期刊)
表2 指标回归系数

据进行回归,不仅可以避免反向指标的回归系数为负,而且便于不同指标的回归系数可比,从而反映出权重的大小。

从回归结果看,R2值为0.983,具有极高的拟合优度,除了引用刊数指标没有通过统计检验外,其他所有指标都在1%的水平上通过了统计检验。由于对反向指标进行了正向处理,所有指标的回归系数均为正值。

3.3 关键指标的确定

将原始指标数据进行标准化后,计算出其标准差、均值、离散系数、极值系数,将表2中的回归系数进行归一化处理得到权重,其结果如表3所示:

表3 指标关键系数

模拟权重较高的几个指标是总被引频次、学科扩散指标,基金论文比、平均引文数、在期刊评价中关注度较高的影响因子、H指数的权重并不高。当然,这可能是由于选取TOPSIS方法评价的原因,如果采用专家会议法确定权重应该不会有如此结果。

从离散系数看,较高的几个指标是即年指标、总被引频次、机构分布数、学科扩散指标,这些指标数据波动活跃,对评价结果有较大影响。最低的几个指标是他引率、被引半衰期、引用半衰期、H指数。

从均值看,他引率、被引半衰期、引用半衰期、基金论文比的均值相对较大,即使在这4个指标中,均值也相差较大,他引率的均值为95.69,而基金论文比只有39.48。13个指标中最低的即年指标的均值只有8.48,数据标准化后均值较低无疑会削弱该指标在评价结果中的比重。

从极值系数看,最高的几个指标是他引率、被引半衰期、引用半衰期、基金论文比,最低的几个指标是即年指标、机构分布数、总被引频次、影响因子。

将模拟权重、离散系数、均值、极值系数标准化后,根据公式(5)计算出关键系数,按从大到小进行排序,结果见表3。关键系数最高的几个指标分别是总被引频次、学科扩散指标、基金论文比、学科影响指标,最低的几个指标分别是H指数、引用半衰期、他引率、即年指标等。这样可以确定在期刊评价中的重要指标和非重要指标。均值、离散系数、极值系数、权重的相关系数如表4所示:

表4 相关系数表

均值、离散系数、极值系数三者之间的相关系数较高,可能与数据的统计学特性有关,极值系数与离散系数有一定的相通之处,权重与其他几个指标的相关系数不高,因为原理不一样。

关键指标确定后,可以通过专家会议法对评价进一步讨论:

(1)权重的合理性,比如本文中影响因子、H指数的权重并不高,是否需要调整。如果继续采用TOPSIS评价,是否要适当进行加权处理。

(2)评价方法的合理性,对于一些无法采用人工权重加以干预的客观评价方法,如熵权法、因子分析法等,如果权重明显不合理,可能要考虑更换评价方法。

(3)对关键指标的数据质量进行检查,本文中关键系数较高的几个指标对评价结果影响较大,当然这都是一些客观指标,如果科技评价中关键指标包括主观指标,那么一定要注意这些主观指标评分的科学性。

(4)对一些不是关键指标的指标进行重新审视,比如H指数的关键系数最低,而H指数作为一种优秀的评价指标,似乎不应该处于这种地位,此时是否应该考虑对H指数的标准化方法进行适当修改,以提高其关键指数。

当然这些工作系统性较强,每次调整后关键系数都会发生改变,也许需要经过多轮调整才会达到理想状态。

4 结语

(1)关键系数一般只具有统计学性质

权重体现了评价者的主观意志,模拟权重体现了评价方法的特点,离散系数、均值、极值系数则体现了评价指标本身的统计学特征,由这4个指标确定的关键系数总体上从统计学的角度反映了关键指标的特点,一般难以从学术评价理论上加以解释。

在这4个确定关键系数的指标中,如果权重是通过专家赋权法确定,那么权重是唯一可以合理进行机动变化的指标,其他指标值一般都是确定的。如果发现关键指标不合理,应该通过权重对关键指标进行适当的调整,而不能仅仅考虑权重本来的重要性。

(2)数据标准化方法与极值数据的质量对关键系数会产生影响

在期刊评价中,正向指标的标准化方法是固定和公认的,一般用指标值除以极大值,但反向指标数据标准化方法则存在一些争议,因为反向指标标准化方法不同会影响到均值、离散系数。进一步地,正向指标标准化方法也可以进行不同的变换,从而影响均值和离散系数。

极值系数的计算方法是用极大值除以均值(正向指标),因此指标极大值的数据质量会影响到极值系数。在期刊评价中,一定要注意基础数据尤其是极值数据的质量。

(3)关键指标有可能会影响权重的确定

任何事物都是相对的,如果关键指标对评价结果影响很大,而自身所代表的评价意义也许并不那么大,此时可能要适当考虑降低该指标的权重,通过降低权重进一步降低其关键系数,使评价更加科学和公平。比如根据本文的研究,基金论文比的关键系数要远远超过H指数。在评价期刊的学术质量时,H指数应该比基金论文比指标重要,在这种情况下,可以适当提高H指数的权重,降低基金论文比的权重,从而提高H指数的关键系数,降低基金论文比的关键系数。

对于一些通过主观方法确定指标值的指标,如果该指标是关键指标,也要慎重进行处理。比如在评价时要用到期刊声誉指标,该指标假如是通过专家评分赋值的,如果采用本文的方法发现该指标是关键指标,最好要适当降低该指标的权重,因为专家评分误差对评价结果的影响很大。

(4)关键指标确定方法的应用具有普适性

目前在期刊评价中,线性评价仍然占据十分重要的地位,主要原因是线性评价总体上比较符合人们的思维习惯,权重确定往往采用专家会议法,能体现出评价者的偏好。通过关键指标的合理性分析,如果发现存在问题,可以通过调整专家赋权的方法得到一定的改进。但在非线性评价中,由于权重本身也是客观的,如果发现关键指标不合理,只能通过调整指标数据标准化方法或更换评价方法解决,相对会复杂一些。因此,本文的方法在线性评价中可以进行推广,不仅可以用在期刊评价中,也可以广泛用在多属性评价中。

参考文献
[1] Hirsch J E. An Index to Qualify an Individual’s Scientific Research Output[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(46): 16569-16572. [本文引用:1] [JCR: 9.737]
[2] Bergstrom C T, West J D, Wiseman M A. The EigenfactorTM Metrics[J]. The Journal of Neuroscience, 2008, 28(45): 11433-11434. [本文引用:1]
[3] 俞立平, 潘云涛, 武夷山. 学术期刊非线性评价模拟权重的动态变化研究[J]. 软科学, 2011, 25(4): 135-140.
(Yu Liping, Pan Yuntao, Wu Yishan. Research on Dynamic Change of Nonlinear Evaluation Simulated Weight of Academic Journal[J]. Soft Science, 2011, 25(4): 135-140. ) [本文引用:1] [CJCR: 0.8047]
[4] 徐耀玲. 评估指标权重设计方法与案例分析[J]. 科技促进发展, 2011(1): 62-67.
(Xu Yaoling. The Evaluation Indicator Weight Design and the Case Analysis[J]. Science & Technology for Development, 2011(1): 62-67. ) [本文引用:1]
[5] 李华, 李政, 顾才东, . 文献计量指标在科技期刊学术影响力评价中权重分析[J]. 中国科技期刊研究, 2010, 21(6): 817-819.
(Li Hua, Li Zheng, Gu Caidong, et al. Bibliometric Indicators in the Evaluation of Academic Influence of Sci-tech Periodicals in Weight Analysis[J]. Chinese Journal of Scientific and Technical Periodicals, 2010, 21(6): 817-819. ) [本文引用:1] [CJCR: 0.9855]
[6] 李卓青, 刘贤, 刘明寿, . 学术质量评价指标权重的确定与商榷[J]. 编辑学报, 2007, 19(5): 389-390.
(Li Zhuoqing, Liu Xian, Liu Mingshou, et al. Ascertainment and Discussion on Weighted Value of Academic Quality Evaluation Indexes of Journals[J]. Acta Editologica, 2007, 19(5): 389-390. ) [本文引用:1] [CJCR: 1.869]
[7] 刘自远, 刘成福. 综合评价中指标权重系数确定方法探讨[J]. 中国卫生质量管理, 2006, 13(2): 44-46, 48. (Liu Ziyuan, Liu Chengfu. Study on Methods of Determining Weight Coefficient of Index in Comprehensive Evaluation[J]. Chinese Health Quality Management, 2006, 13(2): 44-46, 48. ) [本文引用:1]
[8] 俞立平, 潘云涛, 武夷山. 学术期刊综合评价数据标准化方法研究[J]. 图书情报工作, 2009, 53(12): 136-139.
(Yu Liping, Pan Yuntao, Wu Yishan. Research on Data Normalization Methods in Multi-attribute Evaluation[J]. Library and Information Service, 2009, 53(12): 136-139. ) [本文引用:1] [CJCR: 1.193]
[9] Huang C L, Yoon K. Multiattribute Decision Making: Methods and Applications[M]. NY: Springer-Verlag, 1981: 12-34.
(作者E-mail: chinayangzhou@yahoo. com. cn) [本文引用:1]