用户主导下的专家检索可信度评测机制研究<sup>*</sup>

引用本文

李纲, 叶光辉. 用户主导下的专家检索可信度评测机制研究^* . 现代图书情报技术, 2014, 30(7,8): 107-113
Li Gang, Ye Guanghui. Research on Credibility Evaluation Mechanism of Experts Retrieval Under User’s Control. NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE, 2014, 30(7,8): 107-113 复制到剪切板

Permissions

《现代图书情报技术》编辑部

用户主导下的专家检索可信度评测机制研究^*

李纲, 叶光辉

武汉大学信息资源研究中心武汉 430072

通讯作者: 叶光辉 E-mail:3879-4081@163.com

作者贡献声明：

李纲: 提出研究思路, 定稿;

叶光辉: 负责实验和论文撰写。

基金:本文系国家社会科学基金重大项目“智慧城市应急决策情报体系建设研究”(项目编号: 13&ZD173)、武汉大学研究生自主科研项目“跨学科专家科研团队发现研究”(项目编号: 2014104010202)和中央高校基本科研业务费专项资金的研究成果之一。

摘要

【目的】为降低专家检索过程中的噪声并提升用户满意度, 提出构建用户主导下的专家检索可信度评测机制。【方法】在BIR模型基础上, 阐述评测机制运行需要遵循的原则和假设, 围绕专家特征设置参数, 依次设计前后端可信度评测机制。【结果】以学术专家检索为例, 说明后端可信度评测通过求解最佳专家特征向量目长来降低检索噪声, 前端可信度评测将用户相关性反馈作为检索路径选择的必要参照。【局限】前端可信度评测不适用于用户提问较长的情形; 后端可信度评测对专家信息组织方式要求高。【结论】综合两种可信度评测机制, 该机制可提升专家检索关联资源的广度和用户参与的深度。

关键词: 用户反馈; 专家检索; 特征向量; 可信度评测

中图分类号:G353

Research on Credibility Evaluation Mechanism of Experts Retrieval Under User’s Control

Li Gang, Ye Guanghui

Center for the Studies of Information Resources, Wuhan University, Wuhan 430072, China

Abstract

[Objective] In order to reduce the noise and enhance customers’ satisfaction in expert retrieval system, the authors put forward the idea of credibility evaluation mechanism under user’s control. [Methods] Firstly, based on the binary independence retrieval model, this paper brings out the principles and assumptions that the design of evaluation mechanism needs to follow. Secondly, fousing on expert feature to define parameter, this paper has respectively designed the front-end credibility evaluation mechanism and the back-end credibility evaluation mechanism. [Results] Setting academic experts retrieval for example, the authors point out that the front-end mechanism corresponding to information organization attempts to reduce the noise in the expert feature recognition via finding the best length of expert eigenvector, while the back-end mechanism deeply integrates users into the retrieval by setting user relevant feedback as the necessary reference of path selection. [Limitations] The front-end mechanism can not deal with user query including more words, and the back-end mechanism has higher requirement of expert information organization. [Conclusions] Making combination with two mechanisms, this new mechanism can expand associated resources for expert feature recognition and upgrade user involvement.

Keyword: User feedback; Expert retrieval; Eigenvector; Credibility evaluation

Show Figures

1 引言

专家是拥有专门知识和技能, 并能推动知识经济发展的重要群体。通常来讲, 专家多指来自高等院校、科研院所、企业等机构的研究人员。但在互联网时代, 专家的外延正不断被拓展, 科研社区(科学网、小木虫等)、技术社区(CSDN等)^{[ 1]}及QA系统^{[ 2]}中的中心节点也逐渐成为该网络内的专家。网络专家不同于机构专家, 他们属于小众专家。随着机构专家对网络沟通方式的适应, 机构专家和网络小众专家的交集越来越多。因此, 现阶段, 单一根据学术知识库资源来对专家进行特征识别是不完善的, 还需要综合社会网络资源、Web资源来提取专家特征^{[ 3, 4]}。

为了更好地利用专家资源, 不少专家学者都在积极构建科技咨询系统^{[ 5, 6]}、专家检索系统^{[ 7, 8]}、基于本体的专家定位系统^{[ 9]}、FacFinder专家搜索引擎^{[ 10]}、SmallBlue专家搜索软件^{[ 11, 12]}等。检索系统已成为定位和利用专家资源的重要途径, 目前国内三大学术数据库(CNKI、万方和维普)都提供有学者或专家检索入口, 但数据量并不大。截至2013年10月25日, 万方共收录专家11 183位, 且专家信息组织偏重外部特征, 对内容特征的揭示不深。除此之外, 专家检索还存在以下问题:

(1) 综合多渠道信息资源提取的专家特征, 在实现专家信息完备的同时也造成了较大的信息噪声和冲突^{[ 4]}。因此在源头强化专家信息组织方法和技术的同时, 也要在终端引入用户评测机制。

(2) 专家检索存在多种ExpertRank^{[ 13]}算法, 但这些算法只是将用户作为接收检索结果的客体, 没有为用户设置参与算法执行的变量, 用户自主检索功能不强, 更无从谈及个性化专家检索。

基于上述问题获取的检索结果可信度有多高?其大小可作为结果相关度判断的标准之一, 为用户接受或拒绝检索信息提供参考^{[ 14, 15]}。如果将专家检索理解为是对信源实施的可信度评估, 则在专家排名^{[ 4]}、群体决策^{[ 16, 17]}、同行评议^{[ 18, 19]}等咨询活动中, 围绕专家意见或观点所应用的方法、模型、算法、系统等可划定为是对信息内容所做的可信度评估, 目前该领域国内外研究也多围绕此展开。作为序贯相联的过程, 信源可信度评估是后续评估的基础, 对此, 笔者进行了有益的探讨, 希望通过相关可信度评测机制的设计来改进专家检索过程, 提升用户参与度。

2 可信度评测机制

本文阐述的可信度评测机制包括两部分: 前端可信度评测机制, 对应专家检索过程; 后端可信度评测机制, 对应专家信息组织过程。这两部分有机配合, 共同提升着检索结果的可信度。为了最大程度上解决以往专家检索中出现的信息噪声、用户参与度不高等问题, 同时保证前后端可信度评测机制设计的一致性, 有若干设计原则和研究假设需要共同遵循。

2.1 设计原则

(1) 用户自定义原则

自定义使得用户可以根据自身要求来对检索结果进行准确调整。它建立在多次检索反馈基础之上, 用户对检索结果做出相关性评价, 评价结果将通过一组参数来定量化描述, 这组参数将影响下一次检索算法执行时的路径选择。用户自定义原则是可信度评测机制设计的前提和基础。

(2) 收敛原则

一般情况下, 用户找到合适专家即完成当前检索, 但这一过程可能要经历多次反馈。为了避免由于数据库中专家信息不详、缺失等原因所造成的死循环, 当连续多次检索结果趋于一致时, 则确认检索结果趋于收敛。因此, 从某种意义上讲, 收敛是用户能够参与到检索过程中的极限。

2.2 研究假设

可信度评测机制吸收了基于二值独立概率检索模型(BIM)的思想^{[ 20]}, 以概率论为数学理论基础, 包括若干前提假设:

(1) 标引词独立性假设

专家信息组织过程可描述为: 识别与专家相关的资源, 并通过一定方法和技术手段提取专家特征词, 构建专家特征向量。在之前研究^{[ 21, 22]}中, 笔者分别论述了基于学术资源的专家特征识别方法、基于社会网络资源的专家特征识别方法、基于Web资源的专家特征识别方法和综合多种资源的专家特征识别方法, 这4种方法几乎涵盖了获取专家特征的所有途径。无论专家检索系统采用哪一种特征识别方法, 专家特征向量都统一采用二值处理, 即某词在专家特征向量出现则为1, 反之则为0, 这种处理方式即建立在标引词独立性假设之上。

(2) 索引词独立性假设

根据用户类型, 检索提问可分为自然语言检索和专业检索。一般用户使用自然语言表达自身需求, 提交检索后系统会采用基于向量空间模型的方法, 统计词频, 获得用户提问向量。专业用户则直接使用布尔逻辑运算符和关键词来组织检索式, 提交检索后系统通过真值表法^{[ 23]}将检索式解析为用户提问向量。无论是哪一种方式获取的用户提问向量, 都要遵循索引词独立性假设, 采取二值处理方式。

2.3 后端可信度评测机制

(1) 专家信息组织过程

后端可信度评测机制同专家信息组织方法密不可分, 在此笔者采用基于学术资源的特征识别方法来组织专家信息。该方法中专家特征向量设计相对复杂, 主要依托专家发布的学术资源。专家和学术资源具有一对多的发布(issue)关系, 关键词是组成(composite)学术资源的一部分, 笔者采用类图描述了三个实体和两组关系, 如图1所示。专家和学术资源都存在外部特征维度和内容维度。专家的外部特征维度采用四元组<Eid,Ename,Edepartment,Eemail>来描述, 学术资源的外部特征维度使用三元组<Kid,Kname,Kissuer>来描述, Eid和Kid作为主键唯一标识每一条记录, Kissuer和Ename存在着对应关系。

	Figure Option View Download New Window
	图1 专家-学术资源静态结构

鉴于目前多数专家信息组织都偏重外部特征(参照万方的专家检索或CNKI的学者检索), 笔者使用内容维度来完成专家特征向量的设计。作为弱实体, 关键词如社交网络中的标签, 有效地连接了设计过程。图1中实体间多重性经过两次传递, 可推知专家特征向量v_e等同于其发布的n个学术资源中关键词v_k的频次叠加, 形如公式(1), 这样处理充分考虑到专家科研的时间跨度和研究方向演化等因素, 基本描述了专家的研究点。

(1)

(2) 后端可信度评测过程

学术资源包括期刊、专著、专利、标准等。从不同类型资源中抽取的关键词表达力度也不一致, 一般情况下专著的表达力度要强于期刊。不仅如此, 在实际工作中还存在部分文献没有关键词、作者署名次序不一致等问题。鉴于这些情况, 专家特征向量无法精确描述, 且存在噪声。本文降噪方式就是根据专家学术资源中的关键词频次来取舍, 保留中高频次关键词, 放弃部分低频关键词。降噪处理后得到的关键词为专家特征词, 其数量称之为专家特征向量的目长, 用l表示。

组织好的专家特征向量按照与用户提问向量的匹配度倒序输出, 用户对输出候选专家进行评测, 评测采用的指标为P@N, 即判定排名TOP N位候选专家中符合用户需求的人员数量P。设用户需求的专家数量为S, N≥S。如果P<S, 则说明当前输出结果存在较大的噪声。用户需要重新审视专家特征向量v_e, 有些不相关的专家在TOP N位输出, 可能是v_e保留的关键词过多, 有些相关的专家在TOP N位以外, 可能是v_e丢弃的关键词过多, 因此需要n次修正v_e, 直到 P≥S, 此时检索结果已基本可以满足用户的需求。但为了测试当前P个相关专家的可信度(Credibility), 还可以继续修正v_e到n'次, 直到TOP N位中的相关专家集合R收敛于理想专家集合, 其形式如下所示:

(2)

此时确认得到的相关专家集合具有完全可信度, 从中抽取S个就可完成评测过程, 整个后端可信度评测的过程如图2所示。实质上, 后端可信度评测就是寻找最佳目长的过程。

	Figure Option View Download New Window
	图2 后端可信度评测过程

2.4 前端可信度评测机制

(1) 前端可信度评测方法

前端可信度评测主要通过两种方法: 实验法和专家法。实验法步骤主要包括: 构建专家检索平台; 选取标准专家数据集、评测指标(常用指标为P@N、MAP);设立对照组; 通过专家检索平台测试数据集, 并对照分析。

实验法组织的可信度评测建立在过往检索算法(对照组)的基础之上, 不以用户需求满意度为主测评指标, 用户主导性不强, 但评测过程自动化程度较高。专家法则通过问卷、小组讨论等形式, 由领域专家对检索结果进行人工评审。领域专家只是检索用户的一小部分子集, 他们的评审意见将对修正专家检索结果起到关键作用, 但可信度评测反馈过程比较慢。一般情况下, 专家检索结果可信度评测以实验法为主, 专家法为辅^{[ 4, 7]}。

(2) 参数分类及其优先级设置

为实现用户自主的专家检索, 笔者对BIM的参数进行了适当改造, 主要体现为:

①参数分类

前端可信度评测机制需要关联两类参数: 系统预定义参数和用户自定义参数。系统预定义参数属于系统全局变量, 其值选取要基于相应的训练文本集, 且不随用户的变化而变化。用户自定义参数属于局部变量, 仅作用于用户当前检索。

②参数优先级设置

前端可信度评测机制要建立在用户反馈基础之上, 当用户初次检索时, 由于不存在用户反馈信息, 因此需要依据系统自定义参数值来检索。初检后, 用户对检索结果进行定量评价, 完成自定义参数赋值, 之后检索就按照用户自定义值来执行。由两类参数在专家检索中的交互过程可知: 用户自定义参数的优先级要高于系统预定义参数, 即专家检索算法执行时, 检索系统首先判断用户是否自定义了变量值, 如果没有, 则系统根据预定义参数值来获取结果。当对检索结果可信度存在疑问时, 用户可修改预定义值来重新检索。当前检索结束后, 检索系统不会保留用户对系统值的修改, 下一次检索仍然按照系统预定义参数值来执行, 整个过程如图3所示:

	Figure Option View Download New Window
	图3 前端可信度评测过程

(3) 前端可信度评测算法

每一个用户提问向量q都对应一个理想的专家集合, 但关于该集合的特征事先并不知道, 用户对检索结果每一次的可信度评价都将逐步完善它的特征。已知某一专家和查询q相关的概率为, 和查询q不相关的概率为, 则该专家与查询q的相似度如下所示:

(3)

为了保证专家检索的用户自定义功能更具操作性, 公式(3)通过逐级推导和对数运算^{[ 20]}, 最终可得到公式(4):

(4)

其中, 表示q和v_e相对照的语词, 表示q中的权值, 表示v_e中的权值, 表示检出结果集中与q相关专家包含的概率, 表示结果集与q不相关专家包含的概率。如果用表示结果集中揭示的相关专家数量, 用m表示结果集中与q相关专家数量, n表示结果集中专家总数, 表示结果集中揭示专家数量, 则。为了避免出现0值导致无法计算, 实际中使用:

评测过程要基于用户反馈, 因此评测时间包括两部分: 系统检索时间和用户评测时间。两者相比, 用户评测时间对评测效率影响更大, 所以评测过程对q提出一定要求, 一般情况下, q中的关键词数量不宜太多, 3个为宜。由公式(4)可知, 单个关键词至少需要用户设置2个(n和可通过检索系统统计得出)参数才能确立其和, 假设用户提问向量包括3个检索词, 则至少需要用户评测6个参数值。除此之外, 还要确定前端可信度评测的结果集。原则上, 结果集中专家数量要大于用户需求专家数量, 为了和后端可信度评测机制保持一致, 在此笔者选择TOP N结果作为评测结果集。

3 可信度评测机制效果分析

3.1 前后端评测机制对比

后端可信度评测机制通过修正专家特征向量目长来实现用户对检索过程的控制, 目长l是用户可定义的变量; 前端可信度评测机制则更加直接, 在q解析的基础上, 用户对与关键词相关的和m进行相关性判定, 以此来实现对检索过程的控制。两种机制都建立在多次反馈基础之上, 异同点如表1所示:

表1 前后端可信度评测机制异同点

3.2 数据来源和分析

笔者以CNKI为学术数据库, 从管理类、经济类、图情类和计算机类中分别选择IF排名前11的期刊为知识源。根据文献生产者分布的一般规律, 可推知专家应该是该主题领域发文量较高的群体, 因此笔者选择各领域发文量最高的前10位作者作为专家(图情类为20), 采用这种方式构建的候选专家集合虽不够完备, 但易于实现。按照2.3节信息组织方法获取专家特征向量(初始目长l=5), 计算机类专家特征如表2所示:

表2 计算机类专家特征

围绕所有专家特征信息, 笔者以“q=模糊*语义*检索”对后端可信度评测机制进行实例说明, 其结果如表3所示:

表3 后端可信度评测实例分析结果^{[ 21]}

由表3可知, 一方面, 随着目长的不断增加, 专家信息趋于完备, 检索结果集R内的元素虽每一次都在变动, 但相邻两次结果集的交集越来越大, 这些在连续多次检索结果中都出现的元素具有较高的可信度。另一方面, 目长也不能无限增加, 否则将延迟系统处理效率。因此后端可信度评测不一定要R可信度为100%, 只要连续多次R趋于收敛即可。

与此同时, 为了简便起见, 笔者以“q=数据*语义”为提问式, 以表3为专家集合进行前端可信度评测实验。其评测中系统预定义参数需要训练集才能确定, 在此笔者假定表3中10位专家是初次检索按照相关度倒序输出结果, 对上述结果进行相关性评价, XYG、SSZ、SBL和SCY是与查询q相关的文档, 则用户自定义参数值如表4所示:

表4 用户定义参数值

则 , ; , 。根据公式(4)计算得出: , 其他相关度等于0, 则新的专家序列为: SSZ→XXF→XYG→SBL。用户还可以继续对新的专家序列进行可信度评测, 比如XXF专家研究的是关系数据库, 而非知识库、本体库, 可能与用户需求存在偏差。经过若干次的反馈评测, 最终结果可信度将获得提升。

此外, 还要注意, 为了易于展现评测过程, 本文只选取部分作者作为候选专家, 这本身对可信度评测具有一定影响, 主要表现在用户提问与专家特征匹配方面。为了降低这种影响, 实验采用的检索提问和专家特征被限定在同一个主题领域, 即使如此, 由于初检时缺乏词表控制, 还是有可能出现不能匹配的问题, 因此用户提问要具有相对完备的信息。初检后, 用户判断将行使词表职能, 这也是前段评测两类参数设计的原因。随着专家集合的不断增大和词表控制系统的引入, 上述影响将逐步减弱, 但与此同时噪声信息也将增多, 因此结合前后端可信度评测机制构建学科关联性强的领域专家检索系统更为实用。

4 结语

在实际的专家检索系统中, 需要根据实际情况来有机协调两种机制。第2.2节提到专家信息组织有4种识别方法, 后端可信度评测机制与这些识别方法有很大关系, 专家信息组织越好, 后端可信度评测机制发挥的空间越小。基于学术资源的专家识别效果要优于其他方法, 基于网络资源或综合多种资源获取的专家信息可能存在更多噪声和冲突信息, 后端可信度评测机制更适用。相比后端, 前端可信度评测机制更易理解, 用户不用关心专家信息组织方法, 而只关注检索结果与提问的相关程度, 并且用户提问被解析成多个检索词, 更易进行定量化评价。但此时需要注意控制用户提问的长度和检索结果集评价的数量。

脱离了实际系统, 前后端可信度评测机制无从比较。无论哪一种评测机制都不能应用于初次检索, 在对初检结果进行可信度评价之后, 系统才能按照用户要求开启下一轮检索。因此, 下一步笔者将关注如何根据训练集获取系统预定义参数值。

参考文献

View Option

[1]	彭红彬, 王军. 虚拟社区中知识交流的特点分析——基于CSDN技术论坛的实证研究[J]. 现代图书情报技术, 2009(4): 44-49. (Peng Hongbin, Wang Jun. Topology of the Knowledge Communication Network in Virtual Communities——Based on CSDN[J]. New Technology of Library and Information Service, 2009(4): 44-49. ) [本文引用:1] [CJCR: 1.073]
[2]	Liu D R, Chen Y H, Kao W C, et al. Integrating Expert Profile, Reputation and Link Analysis for Expert Finding in Question-answering Websites[J]. Information Processing & Management, 2013, 49(1): 312-329. [本文引用:1] [JCR: 0.488]
[3]	Zhang J, Tang J, Li J. Expert Finding in a Social Network [A]. //Kotagiri R, Krishna P R, Mohania M, et al. Advances in Databases: Concepts, Systems and Applications [M]. Berlin & Heidelberg: Springer, 2007: 1066-1069. [本文引用:1]
[4]	Moreira C, Wichert A. Finding Academic Experts on a MultiSensor Approach Using Shannon’s Entropy[J]. Expert Systems with Applications, 2013, 40(14): 5740-5754. [本文引用:4] [JCR: 1.854]
[5]	王曰芬, 王雪芬, 杨小晓. 基于社会网络的科技咨询专家库的构建方案和流程设计[J]. 情报学报, 2012, 31(2): 116-125. (Wang Yuefen, Wang Xuefen, Yang Xiaoxiao. Research on Construction Schema and Program Design of Social Network-based Expert Database in Scientific and Technical Consulting[J]. Journal of the China Society for Scientific and Technical Information, 2012, 31(2): 116-125. ) [本文引用:1] [CJCR: 1.1348]
[6]	王曰芬, 王雪芬, 颜端武. 基于社会网络的科技咨询专家库的原型系统设计与实现[J]. 情报学报, 2012, 31(3): 250-258. (Wang Yuefen, Wang Xuefen, Yan Duanwu. Prototype System Design and Implementation of the Database about Science and Technical Consulting Experts Based on Social Networks[J]. Journal of the China Society for Scientific and Technical Information, 2012, 31(3): 250-258. ) [本文引用:1] [CJCR: 1.1348]
[7]	陆伟, 韩曙光. 组织专家的检索系统设计与实现[J]. 情报学报, 2008, 27(5): 657-663. (Lu Wei, Han Shuguang. Design and Implementation of Organization Expert Search System[J]. Journal of the China Society for Scientific and Technical Information, 2008, 27(5): 657-663. ) [本文引用:2] [CJCR: 1.1348]
[8]	陆伟, 刘杰, 秦喜艳. 基于专长词表的图情领域专家检索与评价[J]. 中国图书馆学报, 2010, 36(2): 70-76. (Lu Wei, Liu Jie, Qin Xiyan. Expert Search and Evaluation Based on Expertise Vocabulary in the Field of Library and Information Science[J]. Journal of Library Science in China, 2010, 36(2): 70-76. ) [本文引用:1] [CJCR: 2.697]
[9]	刘萍, 叶燕. 基于本体的高校专家定位系统研究[J]. 情报学报, 2010, 29(5): 813-819. (Liu Ping, Ye Yan. An Ontology-based Experts Locator System within Academia[J]. Journal of the China Society for Scientific and Technical Information, 2010, 29(5): 813-819. ) [本文引用:1] [CJCR: 1.1348]
[10]	Fang Y, Si L, Mathur A. FacFinder: Search for Expertise in Academic Institutions [R]. West Lafayette: Purdue University, 2008. [本文引用:1]
[11]	Ehrlich K, Lin C Y, Griffiths-Fisher V. Searching for Experts in the Enterprise: Combining Text and Social Network Analysis [C]. In: Proceedings of the 2007 International ACM Conference on Supporting Group Work. New York: ACM, 2007: 117-126. [本文引用:1]
[12]	Lin C Y, Ehrlich K, Griffiths-Fisher V, et al. SmallBlue: People Mining for Expertise Search[J]. IEEE MultiMedia, 2008, 15(1): 78-84. [本文引用:1] [JCR: 0.984]
[13]	Wang G A, Jiao J, Abrahams A S, et al. ExpertRank: A Topic-aware Expert Finding Algorithm for Online Knowledge Communities[J]. Decision Support Systems, 2013, 54(3): 1442-1451. [本文引用:1] [JCR: 2.201]
[14]	王平, 程齐凯. 网络信息可信度评估的研究进展及述评[J]. 信息资源管理学报, 2013(1): 46-52. (Wang Ping, Cheng Qikai. Review and Progress in Research on Credibility Evaluation of Information on the Web[J]. Journal of Information Resources Management, 2013(1): 46-52. ) [本文引用:1]
[15]	邓发云. 基于用户需求的信息可信度研究[D]. 成都: 西南交通大学, 2006. (Deng Fayun. Information Credibility on User Demand [D]. Chengdu: Southeast Jiaotong University, 2006. ) [本文引用:1]
[16]	梁樑, 熊立, 王国华. 一种群决策中确定专家判断可信度的改进方法[J]. 系统工程, 2004, 22(6): 91-94. (Liang Liang, Xiong Li, Wang Guohua. A New Method of Determining the Reliability of Decision-makers in Group Decision[J]. System Engneering, 2004, 22(6): 91-94. ) [本文引用:1]
[17]	Zhao H X, Yang J P, Wan J. Evaluation Model of Credibility of E-Commerce Website Using Fuzzy Multi-Attribute Group Decision Making: Based on Fuzzy Structured Element [C]. In: Proceedings of Fuzzy Information and Engineering 2010Berlin, Heidelberg: Springer, 2010: 417-424. [本文引用:1]
[18]	徐林生, 王执铨, 戴跃伟. 评审专家可信度评价模型及应用[J]. 南京理工大学学报: 自然科学版, 2010, 34(1): 30-34. (Xu Linsheng, Wang Zhiquan, Dai Yuewei. Expert’s Credibility Model and Evaluation Method[J]. Journal of Nanjing University of Science and Technology: Natural Science, 2010, 34(1): 30-34. ) [本文引用:1]
[19]	李振清, 刘建毅, 王枞, 等. 同行评议专家遴选系统研究与实现[J]. 现代图书情报技术, 2012(5): 81-86. (Li Zhenqing, Liu Jianyi, Wang Cong, et al. Research and Implementation of Peer-review Experts Selection System[J]. New Technology of Library and Information Service, 2012(5): 81-86. ) [本文引用:1] [CJCR: 1.073]
[20]	Grossman D A, Frieder O. Information Retrieval: Algorithms and Heuristics [M]. The 2nd Editon. New York: Springer- Verlag, 2004: 21-32. [本文引用:2]
[21]	李纲, 叶光辉. 基于模糊匹配的跨学科专家团队发现算法研究[J]. 情报学报, 2014, 33(1): 68-76. (Li Gang, Ye Guanghui. Research on Interdisciplinary Team of Experts Discovery Algorithm Based on the Fuzzy Matching[J]. Journal of the China Society for Scientific and Technical Information, 2014, 33(1): 68-76. ) [本文引用:1] [CJCR: 1.1348]
[22]	李纲, 叶光辉. 多源专家特征信息融合研究[J]. 现代图书情报技术, 2014(4): 27-33. (Li Gang, Ye Guanghui. Research on Information Fusion for Multiple-sensor Expert Features[J]. New Technology of Library and Information Service, 2014(4): 27-33. ) [本文引用:1] [CJCR: 1.073]
[23]	郁国瑞, 韦宁. 主析取范式求法解析[J]. 河北能源职业技术学院学报, 2004(1): 92-94. (Yu Guorui, Wei Ning. Analysis of Seeking Main Disjunctive Normal Form[J]. Journal of Hebei Energy Institute of Vocation and Technology, 2004(1): 92-94. ) [本文引用:1] [CJCR: 0.1778]

0.0

1.073

. , 2009(4):44-49

Topology of the Knowledge Communication Network in Virtual Communities——Based on CSDN

(Department of Information Management, Peking University, Beijing 100871, China)

This paper gives a systemic discussion on the Knowledge Communication Network (KCN) drawn from CSDN, trying to mine the character of the knowledge communication in virtual communities. Firstly, the authors analysis properties of the statistics, and point out that the small-world effect and scale-free property do exist in the network. Then find out the two important motifs in knowledge communication through analyzing the triangle of the network.

以国内著名的技术网络论坛CSDN为研究实例，从中抽取出知识交流网络，采用复杂网络的分析方法进行分析，试图定量化地揭示虚拟社区中知识交流的特点。论文一方面分析知识交流网络的基本统计量，指出它具备无标度性质和小世界效应，并对其成因进行分析；另一方面通过分析知识交流网络中的“用户三角形”，揭示了虚拟社区中知识传播的两种基本图式。

... 但在互联网时代, 专家的外延正不断被拓展, 科研社区(科学网、小木虫等)、技术社区(CSDN等)^[1]及QA系统^[2]中的中心节点也逐渐成为该网络内的专家 ...

2013

0.488

0.0

. 2013, 49(1):312-329 DOI:10.1016/j.ipm.2012.07.002

Integrating Expert Profile, Reputation and Link Analysis for Expert Finding in Question-answering Websites

Institute of Information Management, National Chiao Tung University, Hsinchu 300, Taiwan

Question answering websites are becoming an ever more popular knowledge sharing platform. On such websites, people may ask any type of question and then wait for someone else to answer the question. However, in this manner, askers may not obtain correct answers from appropriate experts. Recently, various approaches have been proposed to automatically find experts in question answering websites. In this paper, we propose a novel hybrid approach to effectively find experts for the category of the target question in question answering websites. Our approach considers user subject relevance, user reputation and authority of a category in finding experts. A user’s subject relevance denotes the relevance of a user’s domain knowledge to the target question. A user’s reputation is derived from the user’s historical question-answering records, while user authority is derived from link analysis. Moreover, our proposed approach has been extended to develop a question dependent approach that considers the relevance of historical questions to the target question in deriving user domain knowledge, reputation and authority. We used a dataset obtained from Yahoo! Answer Taiwan to evaluate our approach. Our experiment results show that our proposed methods outperform other conventional methods.

... 但在互联网时代, 专家的外延正不断被拓展, 科研社区(科学网、小木虫等)、技术社区(CSDN等)^[1]及QA系统^[2]中的中心节点也逐渐成为该网络内的专家 ...

2007

0.0

... 因此, 现阶段, 单一根据学术知识库资源来对专家进行特征识别是不完善的, 还需要综合社会网络资源、Web资源来提取专家特征^[3,4] ...

2013

1.854

0.0

... 因此, 现阶段, 单一根据学术知识库资源来对专家进行特征识别是不完善的, 还需要综合社会网络资源、Web资源来提取专家特征^[3,4] ...

... (1) 综合多渠道信息资源提取的专家特征, 在实现专家信息完备的同时也造成了较大的信息噪声和冲突^[4] ...

... 如果将专家检索理解为是对信源实施的可信度评估, 则在专家排名^[4]、群体决策^[16,17]、同行评议^[18,19]等咨询活动中, 围绕专家意见或观点所应用的方法、模型、算法、系统等可划定为是对信息内容所做的可信度评估, 目前该领域国内外研究也多围绕此展开 ...

... 一般情况下, 专家检索结果可信度评测以实验法为主, 专家法为辅^[4,7] ...

2012

0.0

1.1348

... 为了更好地利用专家资源, 不少专家学者都在积极构建科技咨询系统^[5,6]、专家检索系统^[7,8]、基于本体的专家定位系统^[9]、FacFinder专家搜索引擎^[10]、SmallBlue专家搜索软件^[11,12]等 ...

2012

0.0

1.1348

2008

0.0

1.1348

. 2008, 27(5):657-663

Design and Implementation of Organization Expert Search System

组织专家的检索是当前垂直信息检索研究的热门领域,也是组织信息检索研究的重要内容.本文总结了目前国内外组织专家的检索研究现状,分析了构建组织专家的检索系统的需求和挑战,采用基于相关文档集的归并排序法,利用组织内外的网页和期刊数据库等信息智能识别专家的专长,并基于此设计了从数据资源采集、规整、索引、检索到可视化等整个过程的组织专家的检索系统模型及以武汉大学为例的检索系统平台.

... 一般情况下, 专家检索结果可信度评测以实验法为主, 专家法为辅^[4,7] ...

2010

0.0

2.697

2010

0.0

1.1348

. 2010, 29(5):813-819

An Ontology-based Experts Locator System within Academia

专家及其拥有的知识是高校最重要的资产和核心竞争力,专家定位系统能够方便人们迅速查找所需领域的专家信息.然而简单的专家列表不能满足用户选择专家的需求.本文的研究目的在于两个方面:一是如何向用户提供丰富的专家信息,以利于用户对专家的比较和选择;二是如何提高专家排序的准确度.我们利用本体来集成体现专家专长的多源异构数据,同时针对专家集成信息中不同的文档类型和结构设定不同的权重,并利用数据融合技术来提高专家排序的有效性.基于这些关键技术,我们构建了专家查询原型系统,并以武汉大学信息管理学院的教师为实验对象进行了初步测试.结果表明,本文所提出的专家查询方法能够获得较高的查准率.

2008

0.0

2007

0.0

2008

0.984

0.0

2013

2.201

0.0

... (2) 专家检索存在多种ExpertRank^[13]算法, 但这些算法只是将用户作为接收检索结果的客体, 没有为用户设置参与算法执行的变量, 用户自主检索功能不强, 更无从谈及个性化专家检索 ...

0.0

. , 2013(1):46-52

Review and Progress in Research on Credibility Evaluation of Information on the Web

School of Information Management, Wuhan University, Wuhan,430072

Users’ demand on information access, management and service quality becomes increasingly strong because of the rapid growth of information resources on the web; the credibility evaluation of the web-based information has attracted the attention of scholars. We sort out and commented the theory, methods and applications of credibility evaluation of web-based information respectively，and propose recommendations for web-based information credibility evaluation research, and looking to the future research development direction.

网络信息资源的快速增长使用户对其存取、管理和服务的质量需求与日俱增，网络信息可信度的评估研究也引起了学者的关注。本文从网络信息可信度评估的理论、方法及应用三个层面分别进行梳理和评述，并针对网络信息可信度评估的研究现状提出了相应的建议，进而展望其未来研究的发展方向。

... 基于上述问题获取的检索结果可信度有多高?其大小可作为结果相关度判断的标准之一, 为用户接受或拒绝检索信息提供参考^[14,15] ...

2006

0.0

... 基于上述问题获取的检索结果可信度有多高?其大小可作为结果相关度判断的标准之一, 为用户接受或拒绝检索信息提供参考^[14,15] ...

2004

0.0

. 2004, 22(6):91-94

A New Method of Determining the Reliability of Decision-makers in Group Decision

给出一种群决策中确定专家判断相对可信度的方法.主要思路是通过建立专家判断矩阵中包含的直接判断信息与间接判断信息之间的相互关系,确定专家意见的一致程度,从而确定专家判断的相对可信程度.最后,文章给出一个典型的算例以说明该方法的可行性和有效性.

2010

0.0

2010

0.0

. 2010, 34(1):30-34

Expert’s Credibility Model and Evaluation Method

为了正确评价评审专家给出的多属性排序是否合理,该文探讨了多属性评价活动中评审专家可信度的评价准则,研究了评价和决策活动中专家个体可信度的三种建模方法,建立了专家的评价水平排序和分类方法.应用实例表明,该研究结果可以作为评价工作中评审专家选择、调整的依据.

0.0

1.073

. , 2012(5):81-86

Research and Implementation of Peer-review Experts Selection System

1. China Machinery Technical Development Foundation, Beijing 100823, China; 2. School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China; 3. Key Laboratory of Trustworthy Distributed Computing and Service (BUPT), Ministry of Education, Beijing 100876, China; 4. Beijing University of Posts and Telecommunications Library, Beijing 100876, China

The paper designs and implements a peer-review expert selection system for technology projects. Based on experts' information and archives, the system uses statistics-based term extraction technology to solve the unknown words problem, and uses vector space retrieval to calculate the similarity between the project and peer-review experts.Finally,it selects the most appropriate peer-review experts according to the similarity.

设计并实现一个科技项目同行评议专家智能遴选系统,以专家信息和专家档案库为基础,采用基于统计的术语抽取技术解决未登录词问题,利用向量空间检索计算待评审项目和评审专家的相关性,根据相关性大小遴选出最合适的评审专家。

2004

0.0

... 2 研究假设可信度评测机制吸收了基于二值独立概率检索模型(BIM)的思想^[20], 以概率论为数学理论基础, 包括若干前提假设: ...

... 为了保证专家检索的用户自定义功能更具操作性, 公式(3)通过逐级推导和对数运算^[20], 最终可得到公式(4): ...

2014

0.0

1.1348

... 在之前研究^[21,22]中, 笔者分别论述了基于学术资源的专家特征识别方法、基于社会网络资源的专家特征识别方法、基于Web资源的专家特征识别方法和综合多种资源的专家特征识别方法, 这4种方法几乎涵盖了获取专家特征的所有途径 ...

0.0

1.073

0.0

0.1778

. , 2004(1):92-94

Analysis of Seeking Main Disjunctive Normal Form

求主析取范式包括真值表法、推演法以及用真值表法求()G的主析取范式、用推演法求()G的主合取范式等四种方法.用极小项的性质给出了真值表求法的证明,用公式相等的定义证明了求G的主析取范式的定理.

... 专业用户则直接使用布尔逻辑运算符和关键词来组织检索式, 提交检索后系统通过真值表法^[23]将检索式解析为用户提问向量 ...