重点研究数字图书馆服务环境中,基于多个伙伴服务之间的信任协商来建立未经事先注册的用户与被请求服务之间信任度的功能模型和技术机制。
对具有代表性的异构数字仓储互操作相关项目进行简要介绍,结合已有仓储互操作项目经验和OAI-ORE规范,提出基于OAI-ORE的异构数字仓储互操作框架。该框架的核心是使用OAI-ORE抽象数字对象模型对异构仓储不同数据模型进行统一表达,并在其基础上通过设置互操作层的Harvest、Obtain和Put标准服务接口,屏蔽仓储之间的异构性,实现异构仓储复合数字对象获取和存入方法的统一。
概述数字对象唯一标识符(DOI)的发展历史及应用现状,介绍DOI系统的核心Handle System,包括Handle System的名称空间、数据模型以及体系结构等。在此基础上,分析Handle System在中文DOI系统中的应用,解释中文DOI系统与全球handle注册中心(GHR)、本地handle服务(LHS)之间的关系,描述中文DOI系统设计和功能,重点研究基于Handle System的DOI解析机制;最后指出中文DOI系统目前存在的问题。
分析图书馆RFID标准的相关问题,提出若干具体的标准化提案,倡导成立中国图书馆国际标准馆代码管理注册中心(CLMRC-ISIL)和中国图书馆业RFID标准化工作组(CLS-RFID-WG),适时发布中国第一版CLS-RFID-WG指导报告。
采用模型分析方法,对国际标准化组织(ISO)《ISO 23081—2:2007文件元数据概念与实施问题》标准中提出的“法规三元组”元数据模型进行研究和分析,提出元数据模型的基本概念,“法规三元组”元数据模型的基本内容及其在元数据标准制定中的应用。
提出一种基于知网和术语相关度的关系抽取方法。首先通过句法分析提取术语的上下文特征,结合自然语言特征和互信息的方法计算术语之间的相关度,然后使用术语的义原和动态角色作为关键词,在知网语义关系框架中定位关系,并为关系指定明确的语义标签。实验结果表明该方法具有较好的实用效果。
词汇集聚提供了文本的结构启示,因而在许多自然语言处理中有极为重要的应用。介绍基于知网分析词汇集聚的方法,首先利用语义网络的形式将知网知识表示出来;然后在文本概念间有引导地建立推理路径;最后基于路径搜索形成体现集聚的词汇链。测试表明,基于知网推理形成的词汇链基本符合人的直觉,准确率较高。
分析传统知识组织工具数字化、网络化过程中,管理软件的功能和任务,选取了目前比较有代表性的管理软件进行介绍和分析,并参考词表构建的国际标准和早期的软件评价标准,结合词表软件的最新发展,提出开发和选用此类软件的评价标准,以期对国内的词表软件开发、推广,对各类图书馆文献机构选购和使用词表软件提供参考依据,推动知识组织工具的实际应用。
通过构建领域本体,利用用户兴趣与领域本体中概念的映射关系,构建用户兴趣本体,发掘用户兴趣模式。研究用户兴趣本体相似度的计算方法,并通过用户兴趣相似度进行垂直加权,通过时间新颖度进行水平加权,从而利用改进的加权关联规则挖掘算法对用户感兴趣的领域本体中的概念进行挖掘,实现面向内容的协同推荐。
研究基于本体对元搜索引擎查询结果进行自动分类的方法,依据事先构建的药学本体,实现基于本体对元搜索引擎的网页结果进行自动分类的实验系统,形成层次清晰、逻辑合理的分类显示结果界面。最后对实验系统的准确度进行评价,网页分类基本取得预期的效果。
阐述基于网站链接分析的高校评价研究中存在的两点不足,即链接同等重要假设和数据不可靠性。然后设计一种可根据不同网站类型有侧重抓取的广度优先爬虫算法,抓取“211工程”高校网站作为研究样本。基于所得数据构成的社会网络,对社会网络分析中节点重要性测度的3种指标的排名效果进行实验,发现邻近度声望指标最优。并进一步引入PageRank思想,提出一种对邻近度声望指标进行改进的新指标UnivRank。实验结果表明,新指标的效果显著优于其他指标。
针对电子商务研究中未充分重视卖方特点的研究现状,利用自组织映射(SOM)神经网络方法,对手机电子商务交易状况进行聚类分析,研究电子商务卖方的自身特点与其销售商品之间的匹配程度对交易活跃程度的影响,有利于电子商务卖方及产品生产商了解市场状况及自身优劣,以便改进其生产及经营活动。现有的SOM统一距离矩阵(U-matrix)的算法基础上进行修改,提出新的U-matrix算法与显示方法,并应用于本文的数据分析。
介绍中国科学院国家科学图书馆“随易通”系统中的分布安全代理体系的设计和实现,该体系由一系列分布部署、提供安全代理服务、反向代理服务、访问控制功能的代理服务器与对这些代理服务实施集中管理的管理中心组成。
阐述清华大学实现电子图书跨平台应用的前期准备工作,介绍SFX Citation Linker的工作机制,提出利用商业系统的标准接口实现电子图书跨平台应用的具体思路和方案。最后,从如何挖掘商业系统的深层功能实现图书馆主动服务的角度给出建议。
以VoiceXML标准设计开发出一个图书馆专用的语音服务程序,并给出系统的体系结构和功能框架图,以及关键技术的实现。此系统为传统图书馆提供创新服务,使读者可以通过电话访问图书馆Web数据库中的内容,从而大大扩展图书馆的应用范围和服务能力。
针对目前国内图书馆OPAC的检索缺少中文图书的相关网络资源链接点的实际情况,设计一个基于OPAC的开放式中文图书资源库的平台,并提供相应的API接口,方便各图书馆OPAC系统与相关中文图书信息资源整合。
对所借图书进行多书侦测研究,可尽量减少自助式借还书过程中的违规操作,设计一种工作于可见光波段的多书侦测系统。该系统利用摄像装置跟踪被借还图书,提取并分析图书侧面图以判断是否存在违规操作。系统能够自适应地进行图书侧面的识别和提取,具有良好的侦测借还书过程中违规行为的能力。
电子资源日志统计能够提供电子资源评价体系中数据库利用与效用方面的量化指标。设计一种电子资源日志统计系统ERLS,解决其中日志预处理、电子资源统计指标与统计方法、用户定制的动态报表生成等关键技术,并设计开发了原型系统。