1 引言
近年来,学科知识的交叉融合使科学研究呈现出综合性和复杂性的趋势,学者为高效解决现有科研问题,通常开展协同互助的科学活动,该过程也称为科研合作。多项研究显示,科研合作能够有效提高学者科研质量、促进科研产出[1 ] 。所以,高质量的科研合作可极大激励学者进行科研交流和思维碰撞,从而推动科学发展。当前,大多数学者通过社交圈、参加学术会议、历史合作记录等途径选择科研合作者,这些方式容易受到时间、空间等因素的影响且可供选择范围受限,导致学者错失与潜在合作者进行科研合作的机会;虽然学者可以利用科研社交平台进行学术交流发现潜在合作者,但上述平台存在的数据过载及数据质量良莠不齐的问题同样不容忽视[2 ] 。因此,充分挖掘学者特征,为其推荐科研合作者势在必行。鉴于学者相关数据来源多样,不同学者开展合作原因各异,而现有研究往往通过学者兴趣、权威度或社交属性等单项或其中多项属性开展推荐,未能构建学者信息全貌,使科研合作者推荐研究存在一定局限。所以,本文将致力于广泛收集学者数据,构建学者画像,精细分析学者自然属性、兴趣属性、能力属性和社交属性,开展基于学者画像的科研合作者推荐研究,以期提高现有科学合作者推荐水平。
2 相关研究
对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐。基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者。其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐。基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率。此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型。基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐。其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐。由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法。
综合已有研究可知,科研合作者推荐较好地融合了当前学术界的技术方法,在一定程度上发掘出与目标学者具有更高相似度、更高权威度及更高活跃度的科研合作者,但与权威学者推荐、学术兴趣相似学者推荐、审稿专家推荐、问题服务专家推荐等方向的研究相比,科研合作者推荐研究不仅关注学者的研究兴趣、研究能力等属性,还应关注学术年龄、隶属机构的物理距离和所属学科发展水平等自然属性。因此,如何充分获取并挖掘学者自然属性、兴趣属性、能力属性及社交属性,精细构建学者画像,成为提高科研合作者推荐的科学性和准确性亟待解决的问题之一。基于此,本文利用多项数据平台充分收集学者个人数据、论文数据、引文数据和合作数据,利用LDA、PageRank等算法提取学者多维属性,融合构建学者画像,从而实现科研合作者推荐。
3 基于学者画像的科研合作者推荐框架
本文提出基于学者画像的科研合作者推荐模型,从多个学术资源数据库中采集多源数据,按照一定规则对其清洗加工后,抽取学者的自然属性、兴趣属性、能力属性及社交属性,从而精准构建学者画像,如图1 所示。此外,本文模型提供了基于用户偏好和领域内专家决策(层次分析法)两种参数获取机制用以加权融合上述4项属性,综合计算待推荐学者排名,最终实现基于学者画像的科研合作者推荐。
图1
图1
基于学者画像的学者推荐框架
Fig.1
Scholar Recommendation Framework Based on Scholar Portrait
3.1 学者自然属性
学者自然属性包括基本的个人属性,如职称和教育背景可用来表征学者学术能力;年龄和性别具有科研合作的同质性,并且由于自然属性稳定性较好,短时间内不会有较大变动,新入门的学者往往可依据自然属性找到部分潜在合作者,因而学者的自然属性常被用于科研合作者推荐领域。
学术年龄是指一位学者进行学术相关工作的年限,其计算方法是最近一篇学术论文发表年份减去第一篇文章学术论文年份,本文用AA (Academic Age)表示学术年龄。研究表明学者更倾向于与具有相似年龄、学术年龄的学者合作,本文借鉴已有研究[12 ] 将学者按照学术年龄分为三组,即入门学者(AA <12)、青年学者(12≤AA <24)和资深学者(AA≥ 24),并据此进行等级量化处理,得到学术年龄评级,如表1 所示。
在学术界,更高的职称往往代表更高的学术权威性,意味着更高质量的合作产出,因此学者们会更倾向于同高级职称的学者进行科研合作。我国各级科研院所已基本建立起完备的评价体系授予学者职称,对于尚无职称的学者,可以考虑利用教育背景和职称之间的相互关系为其划分等级,例如,博士处于学术生涯的早期阶段,其独立科研的能力尚需加强,因此在量化评级时,将博士与初级职称划分为同一级别;鉴于博士后经过学术训练已基本达到初级学者的水平,且部分地区政策博士后出站可以直接申请副高级职称,因此本文将博士后定级至中级职称。最终,参考相关研究[6 ] 建立起学者教育背景或职称评级,如表2 所示。
受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用。通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率。鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位。
3.2 学者兴趣属性
学者兴趣属性是学者特征提取的核心,已有研究发现,当外部条件具备时,影响科研活动的决定因素是研究者的研究兴趣[10 ] 。在科研合作场景中,拥有相似或相同研究兴趣的学者建立合作关系的成本较低,合作的可能性更高[5 ] 。与此同时,科学研究综合性和复杂性的发展趋势促使学者积极寻求具有互补知识或技能的学者以扩充自身知识体系。因此,本节将精确表征学者兴趣,挖掘学者动态特征,为其寻求研究兴趣相似及互补学者。
为精确表征学者兴趣,基于数据集M 中学者已发表论文的摘要,调用LDA主题模型计算摘要信息的主题概率分布,得到各主题下的论文主题概率分布矩阵;然后,通过遗忘函数模拟学者的兴趣变化[32 ] ,计算遗忘因子Φ j ,如公式(1)所示。
(1) Φ j = 1 e t j l - t j t j l - t j f
其中,Φ j 为第j 篇论文的遗忘因子;e 为自然对数的底数;t j l 为学者在既定时间窗T内最新一篇研究成果对应的时间;t j f 为学者在既定时间窗T内最早一篇研究成果对应的时间;t j 为第j 篇论文发表对应的时间( t j f ≤ t j ≤ t j l ) ,成果发表以年为单位。利用遗忘因子Φ j 对表征学者兴趣的论文主题概率矩阵进行加权,得到各主题下的动态论文-主题概率矩阵。
对于学者S ,取其数据集中所有论文在各主题下动态主题概率值的均值,得到各主题下的学者-主题概率矩阵,作为学者S 研究兴趣的最终表示,如公式(2)所示。
(2) r i = ∑ j = 1 M s Φ j Z i j M s
其中,r i 为主题i 下学者S 的概率值;M s 为数据集中学者S 发表的论文数量;Φ j 为第j 篇论文的遗忘因子;Z i j 为主题i 下第j 篇论文的概率值。最后,将表征学者兴趣的概率值转化为向量表示,利用余弦相似度公式计算学者-主题概率特征向量之间的夹角余弦值,以此衡量学者研究兴趣的相似程度,并用相似度的倒数度量学者间研究兴趣的互补程度。
3.3 学者能力属性
本文将h 指数与逐年发文量相结合,综合表征学者的领域权威度和近期活跃度。由h 指数的概念可知,h 指数综合考虑了学者论文的数量和质量,但鉴于h 指数存在只升不降、无法反映学者近期活跃度的特点,引入逐年发文数指标,以期兼顾学者近期的生产力,参考相关研究[23 ] 得到h T 的计算公式,如公式(3)所示。
(3) h T = λ h + ( 1 - λ ) ∑ t i ∈ T ( t i ) M i t i - t 1 + 1 , i = 1,2 , … , T
其中,h 为h 指数;M i 为逐年发文量;t 1 , t 2 , … , t i 代表年份;T ( t i ) 为该学者最早发文年份到最晚发文年份集合;λ 为调参因子,取值为[0,1]。可以看出,年份越近的发文量,对h T 影响越大。h T 数值越大,表示学者领域权威度和近期活跃度总值越高;反之,则表示学者领域权威度和近期活跃度总值越低。
机构权威度由学者所属机构的建设水平及对应领域内学科评估等级综合得出,本文认为权威度较高的机构在业界具有更高的声誉和更扎实的研究基础。相应地,高权威度机构内的学者具备更好的科研平台,能吸引不同学者开展科研合作。其中,机构的建设水平是指我国政府对高校的建设水平,即985工程、211工程、普通一本、二本、专科等。为了使机构在本领域的学科建设水平方面更具有区分度,本文引入全国第四轮学科评估结果(2017年)完善机构等级评定,该评估结果将学科整体水平得分排名前70%的机构评级为9档,可与高校建设水平相对应。此外,由于海外高校、图书馆、企业等不划分建设工程和录取批次,本文依据这些机构在合作网络中的中心性指标综合考虑其建设水平。海外高校考虑其国际排名,认定为与985同级;高校的图书馆与高校赋予同样的学科等级;其他机构则需要结合数据集中机构包含学者数量、学者h 指数和发文数识别研究院所的学科建设水平。最终,结合机构建设水平和学科评估结果得到的相关机构评级如表3 所示。
其中,∩为交集,∪为并集;A、B、C为表示学科整体水平得分的学科等级,共9档,由高至低排名为A+>A>A->B+>B>B->C+>C>C-。
3.4 学者社交属性
本文通过分析学者论文引用网络、学者合作网络、机构合作网络实现对学者社交属性的判定,具体阐述如下。
引用网络是一种有向网络,包括引用和被引两种方向,已有研究常用PageRank算法表征学者学术影响力,该算法作为一种经典的图机器学习算法,可以自行实现对链接关系中每个节点重要性的迭代计算,相当于一个根据施引者在引用网络中影响力而“加权”的点入度,具有更全面的评价维度。通过计算学者的被引PageRank值,即P R p i 值,实现在学者引用网络中的学者影响力评价,如公式(4)所示。
(4) P R ( p i ) = 1 - q N + q ∑ p j ∈ M ( p i ) P R ( p j ) L ( p j ) , i = 1,2 , … , N
其中,N 为论文总数;p 1 , p 2 , … , p N 代表单篇论文;M ( p i ) 为所有引用p i 的论文集合;L (p j )为p j 引用的论文数量。
合作网络为无向网络(Undirected Network),因此可以直接考虑节点之间的重要性,无需考虑方向。现有研究常用点度中心度和中介中心度这类中心性测度指标表示合作网络中学者的重要性。点度中心度代表该学者直接合作的学者数,表明其直接进行知识交流能力;中介中心度代表该学者担任其他两名学者之间最短路径的次数,表明其信息传递和资源控制能力[33 ] 。在合作网络中,借助这两个指标实现合作网络中对学者重要性的评价,既考虑学者直接进行知识交流的能力,也考虑了学者知识传播的能力。
由于经济水平、学科发展水平、文化、政策、地理距离等因素的影响,机构的合作存在非常明显的小世界性,合作机构通常位于同一省份或相邻省份,机构之间更倾向于强强联合,许多地区被“边缘化”[34 ] 。基于此,本文利用点度中心度和中介中心度指标关注并识别机构合作网络中的重要节点,并将其引入推荐模型中。
3.5 基于用户偏好的学者属性特征融合与推荐
3.1-3.4节分别说明了学者自然属性、兴趣属性、能力属性及社交属性的计算方式。综合来看,学者用户画像共包括4大属性和11项二级指标,如图2 所示。本节将进一步说明融合学者上述属性特征的两种方法:本文模型对用户提供外部参数接口,用以获取读者对各属性及二级指标的偏好;若用户不设定个人偏好,本文模型将采用默认模式,通过对目标学者所属领域专家的调研,实现基于层次分析法(后文将详细阐述)的学者属性特征融合。
图2
图2
学者画像指标体系
Fig.2
Scholar Portrait Index System
当目标学者不设定个人偏好时,本文借助同领域专家对上述属性的偏好进行赋权。层次分析法(AHP)是一种定性和定量结合的决策方法[35 ] ,可用于本文多维度指标融合的计算过程。基于图2 所示的层次指标体系和表4 所示的标度方法,获取领域内专家打分数据,对不同指标进行两两比较和计算以确定各属性的权重;后续利用yaahp元决策分析工具对模型进行层次排序和一致性检验。此外,为消除各指标量纲差异等问题,模型还需对上述指标进行标准化处理,如公式(5)所示。
(5) x ' i j = x i j - m i n { x 1 j , … , x n j } m a x { x 1 j , … , x n j } - m i n { x 1 j , … , x n j } i = 1,2 , … , n
其中,x'ij 为标准化后的数据;xij 为第i 名学者的第j 个指标;max{x 1 j ,…,xnj }和min{x 1 j ,…,xnj }分别为各项指标结果列表中的最高和最低分值。
基于上述人工参数获取或领域专家决策的指标权重测算方法,融合学者自然属性、兴趣属性、能力属性、社交属性得到学者画像从而开展推荐。由图2 可知,每个属性下有各自对应的指标,因此首先对各维度内的指标进行整合。每个维度经过标准化后的得分计算如公式(6)所示。
(6) S c o r e i = ∑ j = 1 m ω i j · x i j
其中,S c o r e i , i ∈ { 1,2 , 3,4 } 分别表示学者的4个维度的得分;ω i j 为维度i 中j 指标的权重;x i j 为标准化后的学者在维度i 中j 指标的得分值。
本文采用线性加权的方法对学者各维度得分进行整合,得到学者的综合得分S c o r e ' ,如公式(7)所示。
(7) S c o r e ' = α ⋅ S c o r e 1 + β ⋅ S c o r e 2 + γ ⋅ S c o r e 3 + δ ⋅ S c o r e 4
其中,S c o r e ' 为学者的最终综合得分;α 、 β 、 γ 、 δ 分别为学者4个维度的权重,本文将按照层次分析法确定具体权值。
最后,本文采用个性化推荐领域较为经典的top-N 推荐法生成推荐结果。对学者的综合分值进行排序,将排列结果中综合得分较高的N 位学者认定为潜在合作者,并将其推荐给目标用户。
4 实证研究
4.1 数据收集与预处理
选择CSSCI(2016版)中16种影响因子大于2的图书情报领域期刊作为本文数据来源,以确保涵盖图书情报学研究前沿和主流方向。在CNKI中选取上述期刊于2015-2019年发表的14 007篇文献,将期刊来源类别限制为CSSCI,文献分类目录选择“图书情报与数字图书馆”。在CSSCI中同样选取上述期刊2015-2019年发表的13 292条引文数据,将学科类别限制“图书馆、情报与文献学”。利用NoteExpress和Excel将CNKI文献信息和CSSCI引文数据进行清洗、去重、汇总,得到9 148条数据,如表5 所示。
利用普赖斯定律确定表5 数据集中的核心作者,其基本计算公式为N = 0.749 m a x ,N 为核心作者候选人的最少发文量,m a x 为所有数据集中发文最多作者的发文量,发表论文数在N 篇以上的作者即为核心作者候选人。借助NoteExpress对CNKI文献数据进行作者频次统计,11 869位作者中,发文量最多的学者其发文频次为56,计算得N =5.6,取其邻近最大整数6,即发文频次≥6的作者可定义为候选核心作者,共有630人。此外,鉴于普赖斯定律仅考虑成果数量而忽略了质量,本文在此基础上结合h 指数选取核心作者,筛选标准如下:发文频次≥6且h 指数≥3的作者为候选核心作者。最终,保留候选作者606人为核心作者集合。
从这些学者所在机构的官网及公开发表的论文信息中获取学者机构名称、省份、机构建设水平、所处学科评分等数据,然后利用人工方式制定规则进行数据清洗和同名消歧。并爬取学者论文摘要数据,借助Python语言将学者的所有摘要文本合并,构建为作者文档,最后采用pkuseg汉语分词包进行分词处理,得到学者信息总表,如表6 所示。
4.2 学者画像构建
在学术年龄层面,基于表1 的分类结果,为相应等级评分赋值,将其映射至[01 ]区间内,如表7 所示。例如,赵蓉英教授学术年龄为18年,属于A2级别。同理,基于表2 学者职称及教育背景对学者权威度进行评级,依次将B6、B5、B4、B3、B2、B1赋值为1、0.8、0.6、0.4、0.2和0,得到学者权威度得分。
在学者所处机构距离的层面,鉴于地理距离与科研合作呈负向影响,因此计算学者所处省份距离矩阵的倒数以衡量学者之间的物理距离,如表8 所示。其中,学者所在省份间距离越近,该部分得分越高。
学者发表的论文信息可以表征其研究内容,因此,将学者摘要文档分分词处理后导入LDA主题模型,主题一致性折线图如图3 所示。基于图3 一致性指标确定最优主题数目K ,由于一致性得分越高,主题的一致性就越好,对应的主题数目越合理,所以本次实验选择主题数为13,计算得到论文-主题概率分布结果。
图3
图3
主题数一致性折线图
Fig.3
Chart of Subject Number Consistency
根据公式(1)计算引入遗忘因子Φ j 的动态论文-概率分布,根据公式(2)得到动态学者主题-概率分布,并据此构建学者的兴趣偏好向量表示,利用向量之间的余弦相似度值和余弦相似度的倒数分别衡量学者之间的兴趣相似度和兴趣互补度,如表9 和表10 所示。
在学术界通常用h 指数表征学者的权威度,用学者逐年发文数表示学者的活跃度,根据公式(3)将二者融合,经过实验,λ =0.3时h T 指标具有较强的区分度和稳定性,因此计算得到学者逐年发文数的h T 指标,如表11 所示。
h T 指标更能区分相同h 指数学者,挖掘出近期活跃度高的学者,评价维度更丰富,实现了对h 指数的修正效果。对比h 指数都为28的学者毕强、赵蓉英可以发现,毕强由于近期发文数较多,其h T 指标就高于赵蓉英,但综合来看,两位学者近期活跃度较高,h T 指标高于h 指数为29的学者李纲。
学者的能力属性一方面可通过学者权威度表征,另一方面也体现在学者所处机构的权威度层面。因此,本文综合机构建设水平和机构学科评估结果两方面对学者所属机构的权威度进行评级赋分,C6、C5、C4、C3、C2、C1分别赋值1、0.8、0.6、0.4、0.2和0,得到学者机构权威度得分,如表12 所示。
基于表5 的文献信息,抽取<作者,引文作者>、<作者,合作者>以及<机构,合作机构>三项二元关系之后,利用Python计算各学者的被引用PageRank值,以表征学者在引文网络中的影响力,排序后的各学者被引PageRank值计算结果如表13 所示。
此外,将606名学者的论文合作数据和机构合作数据导入COOC软件生成合作矩阵,再将合作矩阵导入Gephi生成机构合作网络和中心度计算结果,最终得到作者合作网络图和机构合作网络图,分别如图4 和图5 所示。按照中心度降序的方式输出学者中心度计算结果和机构中心度计算结果,分别如表14 和表15 所示。
图4
图4
学者合作网络
Fig.4
Scholar Cooperation Network
图5
图5
机构合作网络
Fig.5
Institutional Cooperation Network
4.3 各属性值融合及推荐
目标学者可通过个人偏好设置各属性融合方式,也可以通过模型提供的默认接口进行指标融合,默认接口通过专家调查及AHP获取参数。因此,笔者前期向来自武汉大学等院校19名图书情报领域的学者(教授4名,副教授3名,讲师1名,博士7名,硕士4名)发放问卷对上述指标进行综合打分,借助AHP得到均已通过一致性检验的指标权重分配结果,如表16 所示。
为了便于展示本文模型的适用性和科学性,以熊回香教授作为目标学者,利用剩余605位候选学者的推荐情况说明推荐结果,抽取熊回香同其他605位学者在自然属性、兴趣属性、能力属性及社交属性等各项指标上的得分,经公式(5)标准化后进行展示,如表17 所示。前期调查中,由于熊回香未设置个人偏好,因此,本文用图书情报领域专家通过AHP方法得出的参数加权融合各指标,最终得出熊回香教授的潜在合作者,结果如表17 和表18 所示。可以根据需要选择研究兴趣相近或互补的合作学者。其他学者推荐方式同理。
4.4 推荐结果评价
分析熊回香的推荐结果可知,从学者个人属性维度而言,本文模型成功识别出职称较高、与目标学者学术年龄相近、机构距离相近的学者;从学者兴趣属性维度而言,兴趣相似推荐列表中,推荐学者均有和熊回香教授相近的研究方向,如学术能力评价、期刊评价、合作网络、期刊引用等,推荐结果中有多位学者研究领域为信息计量与科学评价相关;兴趣互补推荐列表中,黄如花、鄂丽君等多位学者研究方向为图书馆学,如数字图书馆、信息服务、阅读推广等,金武刚、易斌等学者研究方向为公共文化服务相关领域,均为熊回香研究方向“网络信息组织与检索”的互补知识,能有效扩展该学者的研究思路和知识覆盖面;从学者能力属性维度而言,推荐列表中有16位学者的h 指数均大于15,机构均为985建设水平以上,具有较高的权威度和较好的声誉,而且,本文提出的融合逐年发文量的h 指数,不仅有效地融入了时间指标,还降低了部分h 指数高但近期活跃度下降的学者的推荐得分;从学者社交属性维度而言,推荐学者的被引PageRank值、学者合作中心度、机构合作中心度均较高,这些指标表明推荐学者的论文影响力和质量较高,且合作的意愿较强烈。
5 结语
本文基于学者多源数据,从自然属性、兴趣属性、能力属性和社交属性4个维度构建了学者画像,开展科研合作者推荐研究。在自然属性维度中,重点分析了学者学术年龄、职称或教育背景、机构所属省份三项特征;在兴趣属性维度中,引入遗忘因子处理学者所著文章摘要得到学者兴趣-概率分布,并得到与目标学者研究兴趣相似或互补的学者;在能力属性维度中,以融合了逐年发文年量的h 指数(h T )为主,以机构的整体建设水平和领域内学科建设水平为辅,综合表征学者权威度和活跃度;在社交属性维度中,利用PageRank算法和Gephi软件挖掘学者的引文合作网络关系以揭示学者知识交流和传播的能力。本文模型提供了用户偏好参数获取接口和领域专家层析分析法赋权两种方式,用以线性加权融合上述4个维度的11项指标,得分较高的top-N 学者为推荐的潜在合作学者,生成兴趣相似与互补两类推荐列表供目标学者参考。本文收集CNKI和CSSCI中图书情报领域2015年-2019年的学者和文本资源信息,对模型的可行性和推荐结果的有效性进行验证,取得良好效果。但整体来看,本文模型仍存在一定的不足,如对新入门学者未能完全解决推荐中的冷启动问题,没有考虑不同署名顺序的作者对论文的贡献度,从而影响学者兴趣的精确表征和学术能力的评定。此外,实证环节数据量有限,未采用更多学科领域、更大的样本数据集以及更多语种的样本对模型进行更加科学全面的验证。后续也将以此为契机,开展更充分全面的学术探索,以期为科研合作者推荐研究提供更高效可行的方案。
作者贡献声明
董文慧:提出逻辑架构,设计研究方案,数据获取、处理与分析,论文撰写;
利益冲突声明
支撑数据
支撑数据由作者自存储,E-mail: 437091103@qq.com。
[1] 董文慧. data.xlsx. 科研合作者推荐结果数据.
参考文献
View Option
[1]
Beaver D , Rosen R . Studies in Scientific Collaboration: Part I. The Professional Origins of Scientific Coauthorship
[J]. Scientometrics , 1978 , 1 (1 ): 65 -84 .
DOI:10.1007/BF02016840
URL
[本文引用: 2]
[2]
孙赛美 , 林雪琴 , 彭博 , 等 . 一种基于信任度和研究兴趣的学者推荐方法
[J]. 计算机与数字工程 , 2019 , 47 (3 ):608 -615 .
[本文引用: 1]
(Sun Saimei , Lin Xueqin , Peng Bo , et al . A Recommendation Method for Scholars Based on Trust and Research Interests
[J]. Computer & Digital Engineering , 2019 , 47 (3 ):608 -615 .)
[本文引用: 1]
[4]
Chavarro D , Orozco L A . Policy Change in the Colombian Research Evaluation System of Research Groups: The Need for a Different Route
[J]. Criterio Jurídico Garantista , 2011 , 3 (4 ): 118 -134 .
[本文引用: 1]
[5]
赵蓉英 , 温芳芳 . 科研合作与知识交流
[J]. 图书情报工作 , 2011 , 55 (20 ): 6 -10 .
[本文引用: 2]
<p>Through discussing the definition of scientific research collaboration, the motivations of scientific research collaboration, the relationship between scientific research collaboration and co-authorship, the relationship between scientific research collaboration and knowledge communication, the paper proposes 7 characteristic of scientific research collaboration and summarize it’s definition and 5 collaborative motivations, as well as analyzes the advantages and shortcomings in collaboration research through co-authorship method. The difference and linkage between scientific research collaboration and knowledge communication are also pointed. The paper intends to improve the understanding of basic concepts and theories about scientific research collaboration and make up the shortcomings of theory research in the field of scientific research collaboration.</p>
(Zhao Rongying , Wen Fangfang . Scientific Research Collaboration and Knowledge Communication
[J]. Library and Information Service , 2011 , 55 (20 ): 6 -10 .)
[本文引用: 2]
<p>Through discussing the definition of scientific research collaboration, the motivations of scientific research collaboration, the relationship between scientific research collaboration and co-authorship, the relationship between scientific research collaboration and knowledge communication, the paper proposes 7 characteristic of scientific research collaboration and summarize it’s definition and 5 collaborative motivations, as well as analyzes the advantages and shortcomings in collaboration research through co-authorship method. The difference and linkage between scientific research collaboration and knowledge communication are also pointed. The paper intends to improve the understanding of basic concepts and theories about scientific research collaboration and make up the shortcomings of theory research in the field of scientific research collaboration.</p>
[6]
张丽华 , 田丹 , 曲建升 . 科研合作模式与科研人员角色的变化规律分析——以病毒学领域职业生涯至少为30年的作者为例
[J]. 情报学报 , 2020 , 39 (7 ): 719 -730 .
[本文引用: 2]
(Zhang Lihua , Tian Dan , Qu Jiansheng . Analysis of Change in Research Collaboration Patterns and the Role of Scientific Researchers——Authors in Virology with a Career Period of at Least 30 Years
[J]. Journal of the China Society for Scientific and Technical Information , 2020 , 39 (7 ): 719 -730 .)
[本文引用: 2]
[8]
崔鹤 , 王丹 . 中国高等教育研究领域个体、机构及地域科研合作情况研究——基于2016年18家教育类中文核心期刊的合著文献分析
[J]. 中国高教研究 , 2017 (4 ): 48 -55 .
[本文引用: 1]
(Cui He , Wang Dan . Individual, Institutional and Regional Scientific Research Cooperation in Higher Education Research in China——An Analysis of the Co-Authored Literature of 18 Chinese Core Journals on Education in 2016
[J]. China Higher Education Research , 2017 (4 ): 48 -55 .)
[本文引用: 1]
[9]
李科利 . 长江中游城市群高校科研合作创新: 模式、特征、策略——基于14所研究型大学的社会网络分析
[J]. 湘潭大学学报(哲学社会科学版) , 2017 , 41 (4 ): 23 -27 .
[本文引用: 2]
(Li Keli . The Universities Scientific Research’s Cooperative Innovation in Urban Agglomeration in the Middle Reaches of the Yangtze River: Pattern, Feature and Strategy——The Social Network Analysis Based on 14 Research Universities
[J]. Journal of Xiangtan University (Philosophy and Social Sciences) , 2017 , 41 (4 ): 23 -27 .)
[本文引用: 2]
[10]
邱均平 , 刘艳玲 . 近10年我国合著现象的研究进展
[J]. 图书情报工作 , 2011 , 55 (20 ):11 -14 .
[本文引用: 2]
Based on a literature review and statistics,this paper depicts the current situation of study on co-author in China, including the distribution of authors, journals, and institutions,then summaries four characteristics of the study:①Bibliometric become the major method.②Journals and databases are the main research objects.③Co-author and citation analysis often appear in a same article.④ Social network analysis, international cooperative research, co-author network become the hot topics. The study on knowledge transfer based on co-author is discussed, and four factors that will affect knowledge transfer are proposed, including①the mode of co-author,②the simiarity of knowledge system, ③facilitate of communication, ④ research interest of the author.
(Qiu Junping , Liu Yanling . Research Progress of Co-author Phenomenon in the Last Decade in China
[J]. Library and Information Service , 2011 , 55 (20 ): 11 -14 .)
[本文引用: 2]
Based on a literature review and statistics,this paper depicts the current situation of study on co-author in China, including the distribution of authors, journals, and institutions,then summaries four characteristics of the study:①Bibliometric become the major method.②Journals and databases are the main research objects.③Co-author and citation analysis often appear in a same article.④ Social network analysis, international cooperative research, co-author network become the hot topics. The study on knowledge transfer based on co-author is discussed, and four factors that will affect knowledge transfer are proposed, including①the mode of co-author,②the simiarity of knowledge system, ③facilitate of communication, ④ research interest of the author.
[11]
邱均平 , 余厚强 . 我国情报学领域学者科学合作年龄结构分析
[J]. 情报科学 , 2014 , 32 (8 ):3 -8 .
[本文引用: 1]
(Qiu Junping , Yu Houqiang . Analysis of Scientific Collaboration Age Structure of China Information Science
[J]. Information Science , 2014 , 32 (8 ): 3 -8 .)
[本文引用: 1]
[12]
Wang W , Yu S , Bekele T M , et al . Scientific Collaboration Patterns Vary with Scholars’ Academic Ages
[J]. Scientometrics , 2017 , 112 (1 ): 329 -343 .
DOI:10.1007/s11192-017-2388-9
URL
[本文引用: 2]
[13]
Araújo E B , Araújo N A M , Moreira A A , et al . Gender Differences in Scientific Collaborations: Women are More Egalitarian Than Men
[J]. PLoS One , 2017 , 12 (5 ): e0176791 .
DOI:10.1371/journal.pone.0176791
URL
[本文引用: 1]
[14]
Rosen-Zvi M , Griffiths T , Steyvers M , et al . The Author-Topic Model for Authors and Documents
[C]// Proceedings of the 20th Conference on Uncertainty in Artificial Intelligence (UAI 2004 ). 2012 .
[本文引用: 1]
[15]
Liu Z , Xie X , Chen L . Context-Aware Academic Collaborator Recommendation
[C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining . 2018 : 1870 -1879 .
[本文引用: 1]
[16]
刘萍 , 郑凯伦 , 邹德安 . 基于LDA模型的科研合作推荐研究
[J]. 情报理论与实践 , 2015 , 38 (9 ):79 -85 .
[本文引用: 1]
(Liu Ping , Zheng Kailun , Zou Dean . Research on the Recommendation of S&T Collaboration Based on LDA Model
[J]. Information Studies: Theory & Application , 2015 , 38 (9 ): 79 -85 .)
[本文引用: 1]
[17]
Hirsch J E . An Index to Quantify an Individual’s Scientific Research Output
[J]. PNAS , 2005 , 102 (46 ): 16569 -16572 .
PMID:16275915
[本文引用: 1]
I propose the index h, defined as the number of papers with citation number > or =h, as a useful index to characterize the scientific output of a researcher.
[20]
Prathap G . The Zynergy-Index and the Formula for the h -Index
[J]. Journal of the Association for Information Science and Technology , 2014 , 65 (2 ): 426 -427 .
DOI:10.1002/asi.23046
URL
[本文引用: 1]
[21]
张学梅 . hm 指数——对h 指数的修正
[J]. 图书情报工作 , 2007 , 51 (10 ):116 -118 .
[本文引用: 1]
(Zhang Xuemei . hm Index-A Modification to h Index
[J]. Library and Information Service , 2007 , 51 (10 ): 116 -118 .)
[本文引用: 1]
[22]
龙艺璇 , 赵庆峰 , 赵星辉 . Q 指数——一种考虑了时间因素的新型h 指数
[J]. 图书情报工作 , 2017 , 61 (7 ): 91 -95 .
DOI:10.13266/j.issn.0252-3116.2017.07.013
[本文引用: 1]
<b>[Purpose/significance]</b> Considering the defects of the current research subject evaluation, this paper improves h-index to make the evaluation of research subjects more fair and equitable.<b>[Method/process]</b> Based on the h-index, Q-index was proposed by considering the time factor creatively. We randomly selected four scholars in the field of mathematical science to verify the practicality and reliability of the Q-index by calculating the Q-index of four scholars. <b>[Result/conclusion]</b> The results show that the Q-index changing process can reflect the development trend of research subjects. Therefore, the Q-index can serve as the basis for hiring teachers or evaluating the title. In addition, it can guide researchers towards a healthy and scientific direction.
(Long Yixuan , Zhao Qingfeng , Zhao Xinghui . Q -Index——A New Type of h -Index Considering Time
[J]. Library and Information Service , 2017 , 61 (7 ): 91 -95 .)
DOI:10.13266/j.issn.0252-3116.2017.07.013
[本文引用: 1]
<b>[Purpose/significance]</b> Considering the defects of the current research subject evaluation, this paper improves h-index to make the evaluation of research subjects more fair and equitable.<b>[Method/process]</b> Based on the h-index, Q-index was proposed by considering the time factor creatively. We randomly selected four scholars in the field of mathematical science to verify the practicality and reliability of the Q-index by calculating the Q-index of four scholars. <b>[Result/conclusion]</b> The results show that the Q-index changing process can reflect the development trend of research subjects. Therefore, the Q-index can serve as the basis for hiring teachers or evaluating the title. In addition, it can guide researchers towards a healthy and scientific direction.
[23]
蒲姗姗 . 基于知识互补的科研合作专家推荐模型研究
[J]. 情报理论与实践 , 2018 , 41 (8 ): 96 -101 .
[本文引用: 2]
(Pu Shanshan . Expert Recommendation Model in Scientific and Technical Collaboration Based on Complementary Knowledge
[J]. Information Studies: Theory&Application , 2018 , 41 (8 ): 96 -101 .)
[本文引用: 2]
[25]
Chuan P M , Son L H , Ali M , et al . Link Prediction in Co-Authorship Networks Based on Hybrid Content Similarity Metric
[J]. Applied Intelligence , 2018 , 48 (8 ): 2470 -2486 .
DOI:10.1007/s10489-017-1086-x
URL
[本文引用: 1]
[26]
邓少伟 , 罗泽 , 李树仁 , 等 . 基于论文共同作者学术关系的学者推荐系统
[J]. 计算机工程 , 2013 , 39 (2 ): 12 -17
[本文引用: 1]
(Deng Shaowei , Luo Ze , Li Shuren , et al . Scholar Recommendation System Based on Academic Relationship of Thesis Co-Authors
[J]. Computer Engineering , 2013 , 39 (2 ): 12 -17 .)
[本文引用: 1]
[27]
余传明 , 龚雨田 , 赵晓莉 , 等 . 基于多特征融合的金融领域科研合作推荐研究
[J]. 数据分析与知识发现 , 2017 , 1 (8 ): 39 -47 .
[本文引用: 1]
(Yu Chuanming , Gong Yutian , Zhao Xiaoli , et al . Collaboration Recommendation of Finance Research Based on Multi-Feature Fusion
[J]. Data Analysis and Knowledge Discovery , 2017 , 1 (8 ): 39 -47 .)
[本文引用: 1]
[28]
余传明 , 林奥琛 , 钟韵辞 , 等 . 基于网络表示学习的科研合作推荐研究
[J]. 情报学报 , 2019 , 38 (5 ): 500 -511 .
[本文引用: 1]
(Yu Chuanming , Lin Aochen , Zhong Yunci , et al . Scientific Collaboration Recommendation Based on Network Embedding
[J]. Journal of the China Society for Scientific and Technical Information , 2019 , 38 (5 ): 500 -511 .)
[本文引用: 1]
[29]
郭颍涛 , 杨思洛 , 邝飘 . 中外图书情报学科合作模式比较研究
[J]. 情报理论与实践 , 2013 , 36 (10 ):120 -123 .
[本文引用: 1]
(Guo Yingtao , Yang Siluo , Kuang Piao . Comparative Study of Cooperation Patterns of Library and Information Science Between Home and Abroad
[J]. Information Studies: Theory & Application , 2013 , 36 (10 ): 120 -123 .)
[本文引用: 1]
[30]
陈泳洁 , 赵杨升 , 黄慧媛 , 等 . 基于专利合作数据的医药制造业跨区域创新合作的影响因素实证分析
[J]. 中国药房 , 2020 , 31 (6 ): 641 -646 .
[本文引用: 1]
(Chen Yongjie , Zhao Yangsheng , Huang Huiyuan , et al . Empirical Analysis on Influential Factors of Cross-Regional Innovation Cooperation in Pharmaceutical Manufacturing Based on Patent Cooperation Data
[J]. China Pharmacy , 2020 , 31 (6 ): 641 -646 .)
[本文引用: 1]
[31]
Vishnumaya R S , Nishy P , Mini S . Scientometrics of Rare Earths Research in India
[J]. Current Science , 2016 , 110 (7 ): 1184 -1192 .
[本文引用: 1]
[32]
姚斯琴 . 科研社交网站中个性化信息推荐研究 [D]. 武汉 : 华中师范大学 , 2019 .
[本文引用: 1]
(Yao Siqin . Research on Personalized Recommendation of Academic Social Networking Site [D]. Wuhan : Central China Normal University , 2019 .)
[本文引用: 1]
[33]
Das K , Samanta S , Pal M . Study on Centrality Measures in Social Networks: A Survey
[J]. Social Network Analysis and Mining , 2018 , 8: Article No.13.
[本文引用: 1]
[34]
赵星 . 基于论文合著网络的科研合作研究 [D]. 哈尔滨 : 黑龙江大学 , 2017 .
[本文引用: 1]
(Zhao Xing . Research on Scientific Research Cooperation Based on Paper Co-authorship Network [D]. Harb in:Heilongjiang University, 2017 .)
[本文引用: 1]
[35]
李治东 , 熊焰 , 方曦 . 基于熵权层次分析法的核心专利识别应用研究
[J]. 情报学报 , 2016 , 35 (10 ): 1101 -1109 .
[本文引用: 1]
(Li Zhidong , Xiong Yan , Fang Xi . Application Research of Identifying Core Patent Base on Entropy Weight of Analytic Hierarchy Process Method
[J]. Journal of the China Society for Scientific and Technical Information , 2016 , 35 (10 ): 1101 -1109 .)
[本文引用: 1]
Studies in Scientific Collaboration: Part I. The Professional Origins of Scientific Coauthorship
2
1978
... 近年来,学科知识的交叉融合使科学研究呈现出综合性和复杂性的趋势,学者为高效解决现有科研问题,通常开展协同互助的科学活动,该过程也称为科研合作.多项研究显示,科研合作能够有效提高学者科研质量、促进科研产出[1 ] .所以,高质量的科研合作可极大激励学者进行科研交流和思维碰撞,从而推动科学发展.当前,大多数学者通过社交圈、参加学术会议、历史合作记录等途径选择科研合作者,这些方式容易受到时间、空间等因素的影响且可供选择范围受限,导致学者错失与潜在合作者进行科研合作的机会;虽然学者可以利用科研社交平台进行学术交流发现潜在合作者,但上述平台存在的数据过载及数据质量良莠不齐的问题同样不容忽视[2 ] .因此,充分挖掘学者特征,为其推荐科研合作者势在必行.鉴于学者相关数据来源多样,不同学者开展合作原因各异,而现有研究往往通过学者兴趣、权威度或社交属性等单项或其中多项属性开展推荐,未能构建学者信息全貌,使科研合作者推荐研究存在一定局限.所以,本文将致力于广泛收集学者数据,构建学者画像,精细分析学者自然属性、兴趣属性、能力属性和社交属性,开展基于学者画像的科研合作者推荐研究,以期提高现有科学合作者推荐水平. ...
... 在学术年龄层面,基于表1 的分类结果,为相应等级评分赋值,将其映射至[01 ]区间内,如表7 所示.例如,赵蓉英教授学术年龄为18年,属于A2级别.同理,基于表2 学者职称及教育背景对学者权威度进行评级,依次将B6、B5、B4、B3、B2、B1赋值为1、0.8、0.6、0.4、0.2和0,得到学者权威度得分. ...
一种基于信任度和研究兴趣的学者推荐方法
1
2019
... 近年来,学科知识的交叉融合使科学研究呈现出综合性和复杂性的趋势,学者为高效解决现有科研问题,通常开展协同互助的科学活动,该过程也称为科研合作.多项研究显示,科研合作能够有效提高学者科研质量、促进科研产出[1 ] .所以,高质量的科研合作可极大激励学者进行科研交流和思维碰撞,从而推动科学发展.当前,大多数学者通过社交圈、参加学术会议、历史合作记录等途径选择科研合作者,这些方式容易受到时间、空间等因素的影响且可供选择范围受限,导致学者错失与潜在合作者进行科研合作的机会;虽然学者可以利用科研社交平台进行学术交流发现潜在合作者,但上述平台存在的数据过载及数据质量良莠不齐的问题同样不容忽视[2 ] .因此,充分挖掘学者特征,为其推荐科研合作者势在必行.鉴于学者相关数据来源多样,不同学者开展合作原因各异,而现有研究往往通过学者兴趣、权威度或社交属性等单项或其中多项属性开展推荐,未能构建学者信息全貌,使科研合作者推荐研究存在一定局限.所以,本文将致力于广泛收集学者数据,构建学者画像,精细分析学者自然属性、兴趣属性、能力属性和社交属性,开展基于学者画像的科研合作者推荐研究,以期提高现有科学合作者推荐水平. ...
一种基于信任度和研究兴趣的学者推荐方法
1
2019
... 近年来,学科知识的交叉融合使科学研究呈现出综合性和复杂性的趋势,学者为高效解决现有科研问题,通常开展协同互助的科学活动,该过程也称为科研合作.多项研究显示,科研合作能够有效提高学者科研质量、促进科研产出[1 ] .所以,高质量的科研合作可极大激励学者进行科研交流和思维碰撞,从而推动科学发展.当前,大多数学者通过社交圈、参加学术会议、历史合作记录等途径选择科研合作者,这些方式容易受到时间、空间等因素的影响且可供选择范围受限,导致学者错失与潜在合作者进行科研合作的机会;虽然学者可以利用科研社交平台进行学术交流发现潜在合作者,但上述平台存在的数据过载及数据质量良莠不齐的问题同样不容忽视[2 ] .因此,充分挖掘学者特征,为其推荐科研合作者势在必行.鉴于学者相关数据来源多样,不同学者开展合作原因各异,而现有研究往往通过学者兴趣、权威度或社交属性等单项或其中多项属性开展推荐,未能构建学者信息全貌,使科研合作者推荐研究存在一定局限.所以,本文将致力于广泛收集学者数据,构建学者画像,精细分析学者自然属性、兴趣属性、能力属性和社交属性,开展基于学者画像的科研合作者推荐研究,以期提高现有科学合作者推荐水平. ...
Scale-Independent Indicators and Research Assessment
1
2000
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Policy Change in the Colombian Research Evaluation System of Research Groups: The Need for a Different Route
1
2011
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
科研合作与知识交流
2
2011
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 学者兴趣属性是学者特征提取的核心,已有研究发现,当外部条件具备时,影响科研活动的决定因素是研究者的研究兴趣[10 ] .在科研合作场景中,拥有相似或相同研究兴趣的学者建立合作关系的成本较低,合作的可能性更高[5 ] .与此同时,科学研究综合性和复杂性的发展趋势促使学者积极寻求具有互补知识或技能的学者以扩充自身知识体系.因此,本节将精确表征学者兴趣,挖掘学者动态特征,为其寻求研究兴趣相似及互补学者. ...
科研合作与知识交流
2
2011
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 学者兴趣属性是学者特征提取的核心,已有研究发现,当外部条件具备时,影响科研活动的决定因素是研究者的研究兴趣[10 ] .在科研合作场景中,拥有相似或相同研究兴趣的学者建立合作关系的成本较低,合作的可能性更高[5 ] .与此同时,科学研究综合性和复杂性的发展趋势促使学者积极寻求具有互补知识或技能的学者以扩充自身知识体系.因此,本节将精确表征学者兴趣,挖掘学者动态特征,为其寻求研究兴趣相似及互补学者. ...
科研合作模式与科研人员角色的变化规律分析——以病毒学领域职业生涯至少为30年的作者为例
2
2020
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 在学术界,更高的职称往往代表更高的学术权威性,意味着更高质量的合作产出,因此学者们会更倾向于同高级职称的学者进行科研合作.我国各级科研院所已基本建立起完备的评价体系授予学者职称,对于尚无职称的学者,可以考虑利用教育背景和职称之间的相互关系为其划分等级,例如,博士处于学术生涯的早期阶段,其独立科研的能力尚需加强,因此在量化评级时,将博士与初级职称划分为同一级别;鉴于博士后经过学术训练已基本达到初级学者的水平,且部分地区政策博士后出站可以直接申请副高级职称,因此本文将博士后定级至中级职称.最终,参考相关研究[6 ] 建立起学者教育背景或职称评级,如表2 所示. ...
科研合作模式与科研人员角色的变化规律分析——以病毒学领域职业生涯至少为30年的作者为例
2
2020
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 在学术界,更高的职称往往代表更高的学术权威性,意味着更高质量的合作产出,因此学者们会更倾向于同高级职称的学者进行科研合作.我国各级科研院所已基本建立起完备的评价体系授予学者职称,对于尚无职称的学者,可以考虑利用教育背景和职称之间的相互关系为其划分等级,例如,博士处于学术生涯的早期阶段,其独立科研的能力尚需加强,因此在量化评级时,将博士与初级职称划分为同一级别;鉴于博士后经过学术训练已基本达到初级学者的水平,且部分地区政策博士后出站可以直接申请副高级职称,因此本文将博士后定级至中级职称.最终,参考相关研究[6 ] 建立起学者教育背景或职称评级,如表2 所示. ...
Career and Collaboration Patterns in Tourism Research
1
2016
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
中国高等教育研究领域个体、机构及地域科研合作情况研究——基于2016年18家教育类中文核心期刊的合著文献分析
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
中国高等教育研究领域个体、机构及地域科研合作情况研究——基于2016年18家教育类中文核心期刊的合著文献分析
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
长江中游城市群高校科研合作创新: 模式、特征、策略——基于14所研究型大学的社会网络分析
2
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
长江中游城市群高校科研合作创新: 模式、特征、策略——基于14所研究型大学的社会网络分析
2
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
近10年我国合著现象的研究进展
2
2011
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 学者兴趣属性是学者特征提取的核心,已有研究发现,当外部条件具备时,影响科研活动的决定因素是研究者的研究兴趣[10 ] .在科研合作场景中,拥有相似或相同研究兴趣的学者建立合作关系的成本较低,合作的可能性更高[5 ] .与此同时,科学研究综合性和复杂性的发展趋势促使学者积极寻求具有互补知识或技能的学者以扩充自身知识体系.因此,本节将精确表征学者兴趣,挖掘学者动态特征,为其寻求研究兴趣相似及互补学者. ...
近10年我国合著现象的研究进展
2
2011
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 学者兴趣属性是学者特征提取的核心,已有研究发现,当外部条件具备时,影响科研活动的决定因素是研究者的研究兴趣[10 ] .在科研合作场景中,拥有相似或相同研究兴趣的学者建立合作关系的成本较低,合作的可能性更高[5 ] .与此同时,科学研究综合性和复杂性的发展趋势促使学者积极寻求具有互补知识或技能的学者以扩充自身知识体系.因此,本节将精确表征学者兴趣,挖掘学者动态特征,为其寻求研究兴趣相似及互补学者. ...
我国情报学领域学者科学合作年龄结构分析
1
2014
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
我国情报学领域学者科学合作年龄结构分析
1
2014
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Scientific Collaboration Patterns Vary with Scholars’ Academic Ages
2
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 学术年龄是指一位学者进行学术相关工作的年限,其计算方法是最近一篇学术论文发表年份减去第一篇文章学术论文年份,本文用AA (Academic Age)表示学术年龄.研究表明学者更倾向于与具有相似年龄、学术年龄的学者合作,本文借鉴已有研究[12 ] 将学者按照学术年龄分为三组,即入门学者(AA <12)、青年学者(12≤AA <24)和资深学者(AA≥ 24),并据此进行等级量化处理,得到学术年龄评级,如表1 所示. ...
Gender Differences in Scientific Collaborations: Women are More Egalitarian Than Men
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
The Author-Topic Model for Authors and Documents
1
2004
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Context-Aware Academic Collaborator Recommendation
1
2018
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于LDA模型的科研合作推荐研究
1
2015
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于LDA模型的科研合作推荐研究
1
2015
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
An Index to Quantify an Individual’s Scientific Research Output
1
2005
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Theory and Practise of the g -Index
1
2006
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
The 100 Most Prolific Economists Using the p -Index
1
2010
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
The Zynergy-Index and the Formula for the h -Index
1
2014
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
hm 指数——对h 指数的修正
1
2007
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
hm 指数——对h 指数的修正
1
2007
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Q 指数——一种考虑了时间因素的新型h 指数
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Q 指数——一种考虑了时间因素的新型h 指数
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于知识互补的科研合作专家推荐模型研究
2
2018
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 本文将h 指数与逐年发文量相结合,综合表征学者的领域权威度和近期活跃度.由h 指数的概念可知,h 指数综合考虑了学者论文的数量和质量,但鉴于h 指数存在只升不降、无法反映学者近期活跃度的特点,引入逐年发文数指标,以期兼顾学者近期的生产力,参考相关研究[23 ] 得到 h T 的计算公式,如公式(3)所示. ...
基于知识互补的科研合作专家推荐模型研究
2
2018
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
... 本文将h 指数与逐年发文量相结合,综合表征学者的领域权威度和近期活跃度.由h 指数的概念可知,h 指数综合考虑了学者论文的数量和质量,但鉴于h 指数存在只升不降、无法反映学者近期活跃度的特点,引入逐年发文数指标,以期兼顾学者近期的生产力,参考相关研究[23 ] 得到 h T 的计算公式,如公式(3)所示. ...
Discovering Author Impact: A PageRank Perspective
1
2011
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
Link Prediction in Co-Authorship Networks Based on Hybrid Content Similarity Metric
1
2018
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于论文共同作者学术关系的学者推荐系统
1
2013
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于论文共同作者学术关系的学者推荐系统
1
2013
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于多特征融合的金融领域科研合作推荐研究
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于多特征融合的金融领域科研合作推荐研究
1
2017
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于网络表示学习的科研合作推荐研究
1
2019
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
基于网络表示学习的科研合作推荐研究
1
2019
... 对于科研合作这一社会现象的机制和规律分析,一直受到国内外学者的广泛关注,不少社会学、图书情报领域的学者从科研合作的概念[3 ⇓ -5 ] 、模式[6 ⇓ ⇓ -9 ] 、影响因素[10 ⇓ ⇓ -13 ] 等维度入手,开展了一系列高质量研究,针对科研潜在合作者的推荐研究相对较少,且已有成果基于研究方法可大致分为4类:基于内容的推荐、基于信息计量学指标的推荐、基于链接关系的推荐以及混合推荐.基于内容的推荐,核心在于表征学者历史研究内容,从而将研究领域最相近的科研合作者推荐给目标学者.其中,Rosen-Zvi等[14 ] 在隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型中加入了文献的作者信息,提出了ATM模型,可用于学者分类、相似学者推荐和学者兴趣集中的研究;Liu等[15 ] 提取学者研究主题和学者的活跃度、保守度等基本特征,构建了一个寻找高潜力科研合作者的推荐框架;刘萍等[16 ] 引入关键词信息对学者进行社团划分,然后借助LDA模型提取学者的研究主题,实现科研合作者推荐.基于信息计量指标的学者推荐研究通常借助学者发表的论文数量以及论文的被引量等指标实现权威学者的识别与推荐,自Hirsch[17 ] 在2005年提出的h 指数后,多位学者[18 ⇓ ⇓ ⇓ -22 ] 针对h 指数只升不降、忽视高被引文献等不足提出改进,完善了学者评价指标,提高了权威学者的识别效率.此外,蒲姗姗[23 ] 引入面向主题的h 指数以区别不同研究方向的学者影响力,以此构建综合考虑学者的研究兴趣、知识结构与影响力的科研合作学者推荐模型.基于链接关系的学者推荐主要利用学术网络的链接结构,识别高影响力的核心节点并结合其他评价算法指标开展推荐.其中,Yan等[24 ] 为衡量学者影响力提出了一种考虑引文和协作网络拓扑结构的加权PageRank算法,结合学者兴趣,帮助目标学者发现潜在合作者;Chuan等[25 ] 将论文的内容分析纳入科研合作者链路测度,设计了一种基于内容相似度的网络链接预测指标以发现更多潜在合作者;邓少伟等[26 ] 借助论文合著关系开发了一种基于合著网络的推荐系统,为学者匹配科研合作者;余传明等[27 -28 ] 集成基于节点位置的网络表示学习模型与基于网络结构的网络表示学习模型,利用机器学习进行深度挖掘,实现科研合作者推荐.由于上述三种方法评价维度较为单一,因此,基于这三种方法的混合推荐法成为更受学者青睐的主流推荐方法. ...
中外图书情报学科合作模式比较研究
1
2013
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
中外图书情报学科合作模式比较研究
1
2013
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
基于专利合作数据的医药制造业跨区域创新合作的影响因素实证分析
1
2020
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
基于专利合作数据的医药制造业跨区域创新合作的影响因素实证分析
1
2020
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
Scientometrics of Rare Earths Research in India
1
2016
... 受益于网络通信的快速发展,在线交流极大地削弱了地理距离的影响,但已有研究表明[29 -30 ] ,受时间、空间的限制,地理距离对科研合作仍有明显的负向作用.通常情况下,科研合作主要发生在机构内、校内[9 ] 、省内和国内[31 ] ,机构地理距离较远意味着学者所处单位经济水平、学科建设水平、政治、文化等背景差异较大,直接沟通的成本随之增加,难以迅速、有效地沟通和解决合作中出现的问题,可能会降低合作的可能性,甚至导致合作中止,不利于学者之间建立信任关系,因此,关注学者的地理距离指标能够在降低成本的前提下提高交流效率.鉴于学者所属城市众多,且省内进行科研合作的主力军为省会城市,因此本文将省份之间的经纬度作为地理距离的测量单位. ...
1
2019
... 为精确表征学者兴趣,基于数据集M 中学者已发表论文的摘要,调用LDA主题模型计算摘要信息的主题概率分布,得到各主题下的论文主题概率分布矩阵;然后,通过遗忘函数模拟学者的兴趣变化[32 ] ,计算遗忘因子 Φ j ,如公式(1)所示. ...
1
2019
... 为精确表征学者兴趣,基于数据集M 中学者已发表论文的摘要,调用LDA主题模型计算摘要信息的主题概率分布,得到各主题下的论文主题概率分布矩阵;然后,通过遗忘函数模拟学者的兴趣变化[32 ] ,计算遗忘因子 Φ j ,如公式(1)所示. ...
Study on Centrality Measures in Social Networks: A Survey
1
2018
... 合作网络为无向网络(Undirected Network),因此可以直接考虑节点之间的重要性,无需考虑方向.现有研究常用点度中心度和中介中心度这类中心性测度指标表示合作网络中学者的重要性.点度中心度代表该学者直接合作的学者数,表明其直接进行知识交流能力;中介中心度代表该学者担任其他两名学者之间最短路径的次数,表明其信息传递和资源控制能力[33 ] .在合作网络中,借助这两个指标实现合作网络中对学者重要性的评价,既考虑学者直接进行知识交流的能力,也考虑了学者知识传播的能力. ...
1
2017
... 由于经济水平、学科发展水平、文化、政策、地理距离等因素的影响,机构的合作存在非常明显的小世界性,合作机构通常位于同一省份或相邻省份,机构之间更倾向于强强联合,许多地区被“边缘化”[34 ] .基于此,本文利用点度中心度和中介中心度指标关注并识别机构合作网络中的重要节点,并将其引入推荐模型中. ...
1
2017
... 由于经济水平、学科发展水平、文化、政策、地理距离等因素的影响,机构的合作存在非常明显的小世界性,合作机构通常位于同一省份或相邻省份,机构之间更倾向于强强联合,许多地区被“边缘化”[34 ] .基于此,本文利用点度中心度和中介中心度指标关注并识别机构合作网络中的重要节点,并将其引入推荐模型中. ...
基于熵权层次分析法的核心专利识别应用研究
1
2016
... 当目标学者不设定个人偏好时,本文借助同领域专家对上述属性的偏好进行赋权.层次分析法(AHP)是一种定性和定量结合的决策方法[35 ] ,可用于本文多维度指标融合的计算过程.基于图2 所示的层次指标体系和表4 所示的标度方法,获取领域内专家打分数据,对不同指标进行两两比较和计算以确定各属性的权重;后续利用yaahp元决策分析工具对模型进行层次排序和一致性检验.此外,为消除各指标量纲差异等问题,模型还需对上述指标进行标准化处理,如公式(5)所示. ...
基于熵权层次分析法的核心专利识别应用研究
1
2016
... 当目标学者不设定个人偏好时,本文借助同领域专家对上述属性的偏好进行赋权.层次分析法(AHP)是一种定性和定量结合的决策方法[35 ] ,可用于本文多维度指标融合的计算过程.基于图2 所示的层次指标体系和表4 所示的标度方法,获取领域内专家打分数据,对不同指标进行两两比较和计算以确定各属性的权重;后续利用yaahp元决策分析工具对模型进行层次排序和一致性检验.此外,为消除各指标量纲差异等问题,模型还需对上述指标进行标准化处理,如公式(5)所示. ...