具有知识服务与可持续发展的ISCAS群组知识平台设计与应用*
刘雅静1, 王衍喜1, 郝丹1, 刘子曜2, 王丽3, 周津慧1
1中国科学院软件研究所 北京 100190
2中国科学技术大学软件学院 合肥 230051
3中国科学院国家科学图书馆 北京 100190
摘要

针对科技数据资源的分散性而导致科研主体获取信息方式的单一性问题以及利用开放资源和免费资源的复杂性问题,介绍面向科研主体的资源融汇、知识组织与集成服务的ISCAS群组学科知识平台的设计方法,以及利用支撑工具保障平台可持续性发展的应用实践。

关键词: 知识组织; 知识服务; 集成平台
中图分类号:G250
Design and Application of ISCAS Platform Based on Knowledge Service and Sustainable Development
Liu Yajing1, Wang Yanxi1, Hao Dan1, Liu Ziyao2, Wang Li3, Zhou Jinhui1
1Institute of Software, Chinese Academy of Sciences, Beijing 100190, China
2School of Software Engineering, University of Science and Technology of China, Hefei 230051, China
3National Science Library, Chinese Academy of Sciences, Beijing 100190, China
Abstract

The dispersion of scientific resources leads to the issues that the researchers obtain the information singularly and use the open resources complicatedly. To solve these problems, the method of designing ISCAS group platform based on resource integration, knowledge organization and service integration is proposed, and the practice that keeps the platform developing sustainably by using supporting tools is presented.

Keyword: Knowledge organization; Knowledge service; Integration platform
1 引言

作为科研主体获取有效信息的学科信息环境,正逐步转向以个性化服务为特征的建设与服务模式。中国科学院国家科学图书馆(简称国科图)面向全院设立了“研究所群组集成知识平台可持续服务能力建设”项目,旨在全面提升所级文献情报机构的知识服务能力。笔者所在的中国科学院软件研究所(简称软件所)图书馆借助该项目的支持,构建面向研究所-研究室-课题组三级架构的、具有个性化和可持续发展的知识组织与服务平台,即中国科学院软件研究所群组学科知识平台(Institute of Software, Chinese Academy of Sciences, ISCAS)。该平台以自动获取与自动推送为重要支撑,实现学科信息收集及知识组织、知识发布与知识利用的集成服务,解决因科研过程与文献资源间的疏松性而导致资源不能高效利用的问题,解决因科技数据资源的分散性而导致科研主体获

取信息方式的单一性问题以及开放资源利用中的复杂性和缺失性问题。

2 个性化ISCAS群组学科知识平台设计

以Google Scholar为代表的搜索引擎成为多数科研主体获取资源的首选工具。同时,另有多种文献信息资源组织与导航工具也可实现轻松便捷、快速获取信息的方法与手段[ 1]。然而,作为研究所图书馆资源服务网站,仅仅依靠简单的URL链接引入上述资源服务,难以满足科研主体对知识获取的快速及高效性需求。为此,中国科学院软件研究所图书馆面向研究所-研究室-课题组构建具有可持续发展和个性化、多维度、三级架构的ISCAS群组学科知识服务平台(简称ISCAS平台)。

2.1 知识获取中的技能与服务要求

(1)科研用户的多类性与知识组织要求

科研用户的多类性、信息资源的多源性和检索方式的多样性,势必带来科研主体面对海量信息时因检索方式发散而引发资源获取的低效性和不全面性问题。因此,用户对高效、方便、快速获取原始文献,对检索到的文献进行有序组织和系统显示,对知识组织方法、内容与服务的设计提出了更高的要求,如图1所示:

图1 知识组织与服务要求

(2)科研主体的差异性与服务群体技能要求

就知识服务需求而言,由于科研主体在知识获取与高效利用方面存在个体、团队、机构和学科的差异,决定了因其知识结构不同,对学科资源的熟知度和检索技能熟练度也不尽相同,因此引发了面向科研一线真正做好知识服务的高标准和高难度要求,对学科服务群体提出了“全能型”人才的要求,如图2所示:

图2 服务群体技能要求

(3)平台建设的个性化服务要求

针对ISCAS群组学科知识平台建设,科研主体与学科服务的个性化信息平台需从多视角进行知识组织与服务:

①从学科方向需求角度:需要发现、聚集商业数据库资源、OA资源、免费资源等,通过利用信息过滤、超文本链接、跨库检索等技术把信息资源诸要素有机集成为一个动态的整体,提供一站式检索服务;

②从科研用户角度:对于高端用户,需要聚集基于主题的学科知识分类组织与服务;对于普通用户,需要探索数据资源的功能特性,提供嵌入科研过程的分析功能聚类应用服务;

③从机构或个人科研产出整合角度:需面向团队提供科研产出数据,包括期刊、会议、专利等信息的定期获取、整合与发布;

④从服务方式角度:需提供科研产出数据的高效采集、有效整合与自动推送服务;

⑤从信息资源类型角度:需包括期刊、会议、专利、著作、科研项目、学位论文等资源类型;

⑥从知识组织角度:需利用成熟技术,研发支撑工具,以最大限度减少手工作业方式,高效、快速、准确挖掘领域知识,并经有效组织后提供知识服务。

2.2 个性化ISCAS群组学科知识平台架构设计

依据需求,构建ISCAS群组学科知识环境架构,如图3所示。

该个性化平台架构的特点主要体现在:由一个三方人员参与的服务团队,依据各自的工作特性分别提供不同的支撑服务;由一组支撑工具分别提供从知识组织到知识整合再到知识服务中的自动获取与自动推送功能;用一个“所-室-组”三级架构的服务平台,构建方便、快捷、高效的信息服务平台,以满足不同用户的各种知识获取、知识利用与知识传播需求。

(1)服务层

服务层是三方人员组成的既分工明确又相互配

图3 个性化ISCAS群组学科知识环境架构

合,有不同的技术支撑组合与服务内容组合的支撑服务团队,其主要工作是为平台提供工具研发、知识组织等全方位支撑服务。所级图书馆与国科图协同合作,负责技术支撑,保障平台技术支持和平台初建以及公共资源发现;所级图书馆人员、部门(课题组)科研人员、学科组秘书和部门网管人员组成动态团队,进行需求发现、平台功能设计以及可持续发展建设,为平台高效利用和可持续建设与发展提供服务保障。

(2)支撑层

支撑层是利用国科图研发的中国科学院集成信息平台CASIIP2.0系统作为网页搭建工具;利用机构知识库(Institutional Repository,IR)知识数据嵌入ISCAS群组学科知识平台;利用软件所图书馆研发的领域专家导航平台提供信息采集、知识组织、更新与自动推送服务[ 2],共同实现ISCAS群组学科知识平台中知识组织与知识服务。

(3)平台层

平台层是面向研究所-研究室-课题组三级架构的群组知识服务平台,实现面向全所的数据聚集与知识服务共享。其中研究所级平台建立以计算机科学主题为主线的科技数据聚集,形成主题与专家、主题与机构、主题与成果相关的知识集,实现知识推送与知识服务;研究室级平台对部门相关科技数据信息进行采集和有效整合,实现团队科研产出数据采集、知识组织和重要信息自动推送;课题组平台以重点项目为主导,以专家学科知识为导航,通过学科知识链,建立以学科领域专家或合作伙伴/竞争对手为重要关注点的知识聚集环境,高效发现、了解和跟踪科研产出知识。

2.3 知识组织与服务支撑工具需求分析

知识组织是揭示知识单元,挖掘知识关联的过程或行为, 为用户提供有效知识或信息[ 3]。对科研用户而言,信息资源的多源性和检索工具的多样性对知识组织提出了更高要求:通过分析揭示科研主体类型、信息资源来源及检索方式特性,聚类相似用户群,综合用户群对信息资源的评价,对已有资源进行精简、提取,发现隐含在信息中的有用知识单元,并对其进行整合、组织,向用户提供高契合度的有序知识。因此,必须依托功能强大的支撑工具,才能实现资源的高效利用。

(1)数据采集、整合与发布工具需求

利用数据采集工具高效发现、挖掘、整合科研产出数据。通过自行研发的数据采集与信息检索等支撑工具,实现领域知识发现、知识获取、知识组织与知识提供。

(2)知识聚集与发布工具需求

利用网页生成工具高效整合资源。通过运用网页生成系统集成OA资源、搜索引擎链接、IR资源、期刊网站及免费信息资源网站,实现信息的高效快速获取与利用。

(3)已有资源高效利用工具需求

利用URL和RSS技术,实现重要信息的个性化动态推送。通过领域专家导航平台中URL链接和RSS,实现个人科研产出、团队科研产出等重要信息的个性化动态推送。

(4)信息跟踪与发布工具需求

通过研发工具实现合作伙伴与监测机构科研产出信息的自动推送[ 4]。通过研发机构数据产出与数据采集工具和基于主题的知识整合工具,实现合作伙伴或监测机构、学科团队及个人最新科研产出的数据挖掘、动态监测及知识组织与服务的自动推送。

3 ISCAS群组学科知识平台知识组织与知识服务设计

ISCAS群组学科知识平台从分析资源特性和知识服务内容等方面入手,对知识组织与服务内容的设计主要包括:嵌入科研过程的数据库资源获取与整合及其分析功能的拆分与重组、互联网开放信息资源/专利资源的发现与整合、数据库资源中个人/机构发文信息获取与整合,涉及的资源类型涵盖重要科技产出数据类型,包括期刊、会议、学位论文、专著、专利、著作权、研究报告、项目信息等,需遵循一定的组织原则与方法以保证个性化资源获取与提供。

3.1 资源类型与组织原则

个性化资源包括常规资源、非常规资源、特色资源。其中,常规资源至少包括购买的信息资源和本所自建的信息资源(如馆藏目录、全文数据库、文摘数据库等)[ 5];非常规资源包括专业搜索引擎、重要会议/期刊网站、OA资源、学协会门户;特色资源包括依据学科方向收录的内部特色资源,如本机构内部刊物、研究报告等。ISCAS群组学科知识平台资源组织原则包括:

(1)文献数据资源整合与知识组织

针对全文数据资源、文摘数据资源及专利数据资源,通过按个人或机构对相关数据资源进行采集和整理,形成机构/个人的科技论文与专利信息,使专家个人或机构团队了解其在指定时间段发表的科技论文/专利及相关统计信息。

(2)网络开放资源发现与知识组织

针对网络开放获取的搜索引擎、会议网站、OA资源、学术团体门户、专业服务平台、期刊网站以及其他资源系统的知识发现与组织。

(3)嵌入科研过程的方法/工具发现与组织

针对各数据库系统提供的各种分析功能,研究其与科研活动各阶段的相关性和符合性,对其分析功能进行拆分与重组,嵌入科研活动的选题、科研及成果产出阶段[ 6]

3.2 知识获取和知识组织的方法与手段

以信息科学领域知识为切入点,利用支撑工具实现知识组织与知识服务,是ISCAS群组学科知识平台知识获取与组织的重要方法和手段。具体包括:

(1)支撑个人/机构的文献资源聚集与知识服务方法与工具

通过研究数据聚集与网络搜索关键技术与方法、针对信息科学领域海量数据资源的充分利用、集中展示和高效快速获取等问题,建立以学科领域专家或机构为导航的学科知识链,对信息科学及特定学科领域的数据资源题录信息进行有效整合,为专家本人和机构提供其科研产出信息及合作关系、收录引用情况及课题资助信息,并通过数字对象唯一标识链接阅读原文。从而支持个性化ISCAS群组学科知识平台的信息自动获取、自动更新和自动推送。

(2)基于主题的科技数据聚集与知识服务方法与工具

研究主题提取关键技术、算法及规范化技术与方法,构建以主题为主线的科技数据聚集与知识服务环境。依据科研产出构建主题与专家、主题与机构、主题与关键词规范词表,并以此拓展知识服务和增值服务内容,支持个性化ISCAS群组学科知识平台研究所级的信息聚集和分类整合,为用户提供基于某一主题发文最多的作者、被SCI收录的文献、被引频次最高的文献列表等。

(3)支撑ISCAS平台建设的IIP工具应用

IIP是一种由国科图研发的所级集成信息服务平台,是为研究所一线科研人员及所图书馆员提供的一个信息集成与交互服务的个性化门户平台,可集成第三方开放资源,提供个性化组织和利用信息资源与服务的功能[ 7],具备简单、灵活、实用的特点,为用户提供个性化的内容定制、用户自主进行页面调整、更新以及建立专题数据库、构建多社区服务、便捷集中式管理等功能。

(4)嵌入机构知识库的IR工具应用

利用国科图研发的机构知识库建设工具和软件所已存缴的数据,嵌入到ISCAS群组学科知识平台中,以实现本机构知识资产的高效利用和数据存缴的常态化。

3.3 平台知识组织与服务内容设计

以信息科学领域知识为切入点,以期刊、会议、专利为知识组织的信息源,以发现和嵌入免费资源为平台的拓展服务内容,以支撑工具为自动获取、自动更新和自动推送的重要手段,以推进可持续性发展为主要目标,构建满足科研主体科研活动的ISCAS群组学科知识平台,其知识组织与服务的主要内容包括:

(1)基于数据库分析功能的、嵌入科研过程的资源组织与推送服务。通过分析计算机领域常用全文数据库和文摘数据库提供的分析功能,结合科研活动流程进行拆分和重组,将重要功能嵌入科研活动的各个阶段,形成拟获取的重要信息与数据库间的无缝链接,并依此构建一站式检索环境,实现资源快速导航与信息高效获取。

(2)基于机构科研产出的知识组织与面向团队的知识服务。通过对机构科研产出的数据进行检索、采集、整合,导入软件所机构知识库(ISCAS-IR)中,再分别按“所-室-组”三级架构提取机构数据,并以此嵌入群组平台。

(3)基于人员科研产出知识组织与面向个人的知识服务。对个人科研产出数据进行检索、采集、整合、构建,并以此嵌入群组平台。

(4)基于ISCAS平台底层数据的主题知识聚类与知识服务。对“室-组”级科研产出知识进行主题聚类,分别按最有影响力专家、论文、专利及项目进行组织与发布。

(5)基于免费资源的知识组织与服务。集成免费的领域OA资源、搜索引擎链接、IR资源、期刊网站及专利信息资源网站。

4 ISCAS群组学科知识平台可持续发展设计
4.1 ISCAS平台可持续发展设计框架

服务于科研一线的学科信息环境,应达到自动化动态更新和保证长期有效使用的目的,通过建立管理/运行机制、规范建设机制、运用知识组织与自动推送服务的支撑工具,才可保障群组学科知识平台的可持续性发展,其设计框架如图4所示:

图4 ISCAS平台可持续性发展设计框架

4.2 ISCAS平台可持续发展机制与规范

(1)支撑ISCAS平台的管理/运行机制

管理/运行机制是保证平台可持续发展的根本。ISCAS平台的管理/运行机制包含了平台保障机制、团队建设机制、服务机制及平台维护机制。平台保障机制主要包括设备、资金、技术、人员、服务等保障内容;团队建设机制是依据平台建设人员权责与分工建立高效合作模式和协同机制,通过互通、互商、共建等方式,形成需求与支撑的正反馈,并从工具使用、平台搭建与移植、政策法规及知识产权保护等多方面开展定期培训,提高团队人员工作素质;服务机制支持在平台建设的不同阶段,挖掘整合用户对平台的需求,并提供满足用户需求的服务;平台维护机制是建设团队与平台用户约定维护责任与维护内容的制度,包括支撑工具维护、硬件及网络环境维护、平台一般内容及个性化内容维护等。

(2)支撑ISCAS平台的规范

ISCAS平台从知识内容组织与维护、知识内容管理与利用以及维护知识产权三个方面来制定平台规范。通过建立平台操作流程和规范,指定知识产权保护条例和相关政策,保证数据内容的采集动态性和更新时效性,保障数据内容的准确性和数据利用的合法性。

5 应用服务实践
5.1 利用CASIIP2.0系统构建ISCAS平台功能

ISCAS群组学科知识平台选取了CASIIP2.0系统作为搭建工具。CASIIP2.0是一套基于Portal和CMS内容管理的集成信息系统,能满足各种不同需求的扩充或结合,最终实现所级集成信息服务平台的所有功能[ 7]。结合ISCAS群组学科知识平台项目需求,平台功能架构如图5所示:

图5 个性化ISCAS群组学科知识平台功能框架

(1)利用CASIIP2.0系统定制管理功能

包括门户定制管理、平台系统管理、用户权限管理、用户个性化管理、网站统计等模块。实现平台的公共服务定制、用户权限管理和网站访问统计分析,同时开放普通用户进行个性化空间定制管理和整个平台的布局风格、设置用户访问权限等。

(2)利用CASIIP2.0系统定制内容管理功能

包括定制动态信息编辑发布管理以及全站检索等模块,发布新闻、资讯、资源等,使用户可以进行站内信息一站式检索。利用该模块ISCAS平台提供了新闻公告、图书馆指南等描述性内容以及构建科研流程模型,提供嵌入科研过程的文献资源使用推送服务;通过数字对象唯一标识符(Digital Object Identifier, DOI)链接原文,实现科研团队、个人、合作伙伴/监测机构科研产出挖掘及知识推送;通过跨库检索技术,采集第三方数据资源的有效信息;借助URL实现科研主体科研成果动态信息推送,并根据需求实现定期自动更新。

(3)利用CASIIP2.0系统定制接口功能

包括定制RSS和页面嵌入等建设模块,通过加入多个RSS Feed,嵌入公共平台、第三方机构等网站的页面集成。利用该模块可实现以软件所机构知识库作为数据源,将科研成果分类,主要包括学位论文、期刊/会议论文、专利、项目、成果、软件著作权等信息,利用页面嵌入和RSS技术,嵌入到学科信息平台中,使相关部门/人员可以方便、及时、准确地看到团队的最新作品。

5.2 基于CASIIP2.0实现ISCAS群组集成知识服务

(1)基本服务

CASIIP2.0系统的基础服务提供了构建一个门户的必要基础,包括内容管理系统(CMS)、集成框架(Iframe)、登录与注册、语言工具栏等建设网站的必备工具[ 8],实现门户内容发布、资源整合、集成检索等基本功能,用于ISCAS平台建设以下基本服务,如图6图9所示:

图6 最新消息页面

图7 专业信息门户

图8 下载专区页面

①最新消息发布服务:包括由管理员发布的部门新闻公告、最新成果及业界动态。其信息的发布通过CASIIP2.0系统内容管理中的信息发布功能来实现。

②专业信息门户提供服务:包括新书预告、重要期刊推荐、专业学/协会网站等内容,利用网页嵌套、URL链接及内容管理功能,实现科研所需资源的集成整合。

③资源下载专区:包括培训课件下载、制度指南下载等。下载专区包含三个二级页面,通过添加导航列表的形式,将与下载相关的内容集成于同一页面,并通过点击导航中的列表切换下载内容。每个二级页面中的下载条目通过管理员在服务器上传文档,利用URL技术实现直接弹出页面。

(2)应用服务

CASIIP2.0系统的应用服务提供了构建一个门户的扩展功能,利用RSS、网页嵌套、URL技术等应用,实现第三方机构平台及工具的嵌入集成,使之成为一个应用系统。该功能用于ISCAS平台建设以下应用服务,如图10至图13所示:

①科研成果展示:将科研成果划分为科技论文、专利、学位论文等类型,以ISCAS-IR为数据来源,利用平台添加导航及网页嵌套功能,巧妙实现ISCAS-IR应用,实现科研成果集成展示与检索。

②科研团队信息展示:以课题组为单位,将科研人员信息集中呈现,通过网页嵌套及URL链接,嵌入软件所领域专家导航平台,实现点击“论文原文最新列表”即可展现科研人员发文情况。

③研究所SCI最新发文推送:利用RSS订阅功能,管理员在后台制定RSS Feed,即可将研究所最新发文自动推送到页面上,并实现定期更新。

基于CASIIP2.0实现的ISCAS群组集成知识平台,提供了支撑服务学术科研的个性化学科信息环境,尤其高度集成科研主体所需资源与服务,为科研人员提供了一站式知识检索平台,对提高研究所科技创新能力具有支撑作用。

6 结语

ISCAS学科信息平台建设可划分为三个阶段:以需求指导建设为宗旨,有目标、分步骤建平台,避免盲目建设后的返工现象;总结共性与个性问题,搭建出平台雏形,以雏形为模板复制共性内容,突出自动推送、科研成果嵌入、集成检索等个性特点,以点带面,完善平台功能建设;移交用户前准备好平台管理规范与知识产权保护文档并积极开展培训,为可持续性建设提供保障。

综上所述,笔者所在团队在面向多维度服务对象时,提供学术科研活动的资源融汇与集成服务,形成嵌入科研过程的知识提取、知识组织、知识整合的、具有动态信息推送的资源集成与知识服务的个性化学科信息平台,最大限度地利用了各类资源,避免了资源重复建设。

参考文献
[1] 周津慧, 王衍喜, 王永吉, . 基于领域专家学科知识链的文献资源组织与导航[J]. 科研信息化技术与应用, 2011, 2(1): 33-42.
(Zhou Jinhui, Wang Yanxi, Wang Yongji, et al. Organization and Navigation of Literature Resources Based on Subject Knowledge Chain Among Disciplinary Domain Experts[J]. E-Science Technology & Application, 2011, 2(1): 33-42. ) [本文引用:1]
[2] 郝丹, 周津慧, 关贝, . 文献跨库检索中去重方法研究与应用[J]. 现代图书情报技术, 2011, 27(7-8): 116-120.
(Hao Dan, Zhou Jinhui, Guan Bei, et al. Research on Duplicated Literature Deletion Method Based on Cross-database Search[J]. New Technology of Library and Information Service, 2011, 27(7-8): 116-120. ) [本文引用:1] [CJCR: 1.073]
[3] 百度百科. 知识组织[EB/OL]. [2012-03-15]. http://baike.baidu.com/view/1037808.htm.(BaiduPedia.KnowledgeOrganization[EB/OL]. [2012-03-15]. http://baike.baidu.com/view/1037808.htm [本文引用:1]
[4] 王衍喜, 周津慧, 王永吉, . 一种基于科技文献的学科团队识别方法研究[J]. 图书情报工作, 2011, 55(2): 55-58, 98. (Wang Yanxi, Zhou Jinhui, Wang Yongji, et al. A Study of Discipline-Team Members Recognition Method Based on Literature[J]. Library and Information Service, 2011, 55(2): 55-58, 98. ) [本文引用:1]
[5] 徐坦, 付鸿鹄, 孙坦. 中国科学院所级图书馆门户建设实践与思考[J]. 现代图书情报技术, 2006 (6): 26-30.
(Xu Tan, Fu Honghu, Sun Tan. Deployment and Thinking of Institutional Library Portal in Chinese Academy of Sciences[J]. New Technology of Library and Information Service, 2006(6): 26-30. ) [本文引用:1] [CJCR: 1.073]
[6] 刘雅静, 周津慧, 王衍喜, . 嵌入科研过程的数据库功能重组方法与服务实践[J]. 图书情报工作, 2012, 56(5): 67-72.
(Liu Yajing, Zhou Jinhui, Wang Yanxi, et al. Functional Restructuring and Practice of Literature Database Embedded in the Scientific Process[J]. Library and Information Service, 2012, 56(5): 67-72. ) [本文引用:1] [CJCR: 1.193]
[7] 刘毅, 汤怡洁, 杨锐, . 基于Liferay Portal的所级图书馆集成信息服务平台设计与实现[J]. 现代图书情报技术, 2008(6): 72-77.
(Liu Yi, Tang Yijie, Yang Rui, et al. The Design and Implement of Institution Integration Information Platform Based on Liferay Portal[J]. New Technology of Library and Information Service, 2008(6): 72-77. ) [本文引用:2] [CJCR: 1.073]
[8] 孟晓川, 马自卫. 基于Liferay的多维化门户系统在数字图书馆中的研究与实现[J]. 现代图书情报技术, 2008(12): 8-14.
(Meng Xiaochuan, Ma Ziwei. Research and Implementation of Multi- dimensional Portal System in Digital Library Based on Liferay[J]. New Technology of Library and Information Service, 2008(12): 8-14. )
(作者E-mail: jinhui@iscas. ac. cn) [本文引用:1] [CJCR: 1.073]