以北京大学图书馆的多媒体资源元数据规范为案例,阐述多媒体资源及其元数据规范的特点、集成设计思路和成果,并结合实际案例探讨该规范的创新应用,以及设计和应用过程中的问题和解决方法。
就如何实现OA资源的全文检索进行探讨,分别阐述目前OA资源检索平台的现状及实现全文检索的难点,提出并实现以搜索引擎为代理自动完成对OA资源全文进行检索的技术方法,且对该方法从系统设计和技术细节两方面进行解析。测试表明,以搜索引擎为代理的OA资源统一访问平台的全文检索工具的检索效率及质量基本令人满意。
在参考OASIS提供的ebXML规范分类方法的基础上,通过分析ebXML规范以及组件关系,改造ebXML规范的分类,从而为ebXML规范在UDDI中注册提供合适的分类。并基于改造后的分类,描述ebXML规范分类方法的设计与实现过程,简要描述ebXML规范在UDDI中的注册过程。
以中国水力发电工程特色库为例,介绍利用GIS技术实现专题特色库网上发布系统的技术路线,重点阐述系统的功能划分、数据组织与检索机制。
针对当前知识组织和服务中存在的问题,提出一种基于模块化本体的知识组织与服务体系结构(Mo-KOS),并分析Mo-KOS自治知识组织的原则、质量控制及其实现流程,探讨自治的、个性化知识服务实施方案。该体系能够向用户提供自治的知识组织、自治的个性化知识服务。
针对目前企业对信息化管理软件的个性化需求,提出基于Web的信息系统柔性框架。阐述柔性开放框架的特点及优势,分析在VS2005环境下,实现该柔性框架所应考虑的不同技术层面,并对其中的关键技术以及具体实现方法进行深入的探讨,应用该框架为安徽某公司开发的人力资源管理系统实例说明了此柔性框架是一种可行的个性化信息管理软件解决方案。
音频信息可视化是信息可视化在音频信息资源管理中的应用,语音是音频信息的重要组成部分。文章构建并分析语音信息可视化框架,并辅以实验系统验证其实用性,最后讨论语音信息可视化需要继续研究的问题。
针对企业专家的专长识别与检索问题,采用文档权重归并法,利用TREC W3C数据集实现企业内的专家检索,并与专家档案法进行了比较。研究结果表明同样采用BM25模型,采用文档权重归并法具有稳定的优势。
在研究传统的基于特征码去重算法的基础上,针对元搜索引擎中网页重复现象,提出一种基于用户查询关键词的网页去重方法,提高元搜索引擎检索质量,并且介绍算法的实现过程,通过实验验证算法的有效性。
以网络搜索中语言使用的特征为研究对象,旨在对网络搜索中查询式的句法和语义问题进行探索性的研究。主要使用搜索引擎查询日志挖掘的方法,辅以网络问卷调查法所得到的结论进行比较分析,得出在句法、词汇类别、辅助词和主体词等方面的特征。
以用户的自然、社会属性对用户在搜索中使用检索语言的影响为研究对象,旨在对影响用户行为的因素作探索性研究。综合网络调查问卷的分析结果和用户参与对比实验法,得出性别、年龄、学历和专业教育对用户语言使用影响的结论。对于此问题的研究,有助于认清搜索过程的影响因素,进而可以以此建模,改善搜索引擎的服务质量。
简要分析站点结构优化和站点信息组织之间的关系,将站点结构优化方法划分为两类进行综述,并讨论每种方法的优势、不足和进一步研究的方向。
概括当前高校开展服务质量评价工作的现状,参照LibQUAL+TM实现模式,以本馆服务质量评价系统的开发实践为例,从设计思路、系统功能、技术实现等几个方面介绍实现服务质量评价的系统方法,为图书馆开展服务质量评价工作提供一定的参考依据。
从图书馆数字化建设对存储系统的需求出发,阐述福州大学图书馆存储系统架构设计、发展规划、产品选型、系统部署和扩容调整等,以及对存储系统中不同数字化应用进行特定的性能优化,从而提高存储系统整体性能和空间利用率,更好地满足本校“211工程”建设要求,提高经济性。
在分析常见的负载均衡技术的基础上,针对北京大学数字图书馆门户服务的特点,给出基于NAT的负载均衡系统在负载均衡策略、会话保持机制和健康检测模块这三个方面的配置方案。
主要介绍一个用现有CNMARC书目记录实现基于FRBR模型的OPAC系统。首先介绍系统的功能,实现该系统的数据库结构及详细说明,然后分析系统的实现过程,并详细说明CNMARC书目记录聚合成FRBR对象的聚合算法。
针对图书馆馆藏急剧增长的现状,提出一种基于读者借阅信息的科技图书检索结果客观排序算法,并以中国海洋大学图书馆为例,基于SQL Server数据库实现图书检索结果排序。实验表明,排序算法对读者的查准率有较大改善,能很好地满足图书馆读者的信息检索需求。
以汉语题名目录的模糊检索为例,对机读目录目前存在的模糊检索问题进行分析,提出一个基于集合运算的改进方案,通过细粒度拆分待检题名并将拆分所得的各元字符作为冗余待检题名逐一执行检索,再对全部检索结果执行有关集合运算实施聚合,以得到尽可能接近检索者本意的题名及其馆藏信息,增强机读目录的模糊检索深度,低成本优化现行检索系统。
使用数据挖掘技术的决策树算法,以图书馆流通信息和读者信息为研究对象,通过计算各属性间的信息增益度,构造完整的活跃读者决策树,得出活跃读者的评价规则,并提出活跃读者的管理模式,为图书馆有针对性的深层次服务提供决策依据。