介绍国家图书馆数字图书馆系统由数字资源采集与制作、数字资源的永久保存与存储管理、数字资源发布与服务、灾害备份等子系统组成。构造现代图书馆的信息网络化服务平台需要,全面整合图书馆的服务和自动化系统。作为目前中国最大的数字图书馆系统总体设计之一,国家数字图书馆工程的设计尚存在很多问题需要在实施过程中逐步解决。
简单介绍中文信息处理;指出在中文信息处理中存在的问题,论述中文信息处理对汉字属性字典研究的必要性和重大意义及其在国家图书馆数字图书馆中的应用前景。
综述集群技术的发展趋势,并以中国科学院计算所的Phnonix异构集群系统在数字图书馆建设中的应用为例进行具体论述,提出如何在数字图书馆环境下利用异构集群系统构建集群管理框架,在广域网环境中提供网格计算虚拟平台和海量数据检索引擎的具体思路。
分析目前国内外几种有代表性的虚拟存储技术模型和所涉及的相关协议。介绍该技术在国家数字图书馆中的应用设想。探讨虚拟存储技术的应用将对国内数字图书馆产生的深远影响。
从信息检索理论出发,采用信息检索技术与集群技术相结合的模式构建一个数字图书馆检索系统架构,并在此架构基础上,以千万级的元数据,大规模模拟并发做了一系列实验,对实验结果进行分析和研究,最后对系统的扩展性进行推演。
在分析MARC ISO 2709交换格式局限性的基础上,对MARC的XML交换格式(MarcXchange和MARCXML)进行分析和研究,阐明MarcXchange的原理、结构、作用和意义,并对MarcXchange和ISO 2709进行比较。针对用OAI实验MARCXML的结果,指出OAI的局限性。最后提出CNMARC应用XML交换格式的具体建议。
简单介绍汕头大学图书馆自建或参建数据库现有检索系统存在的问题和NET Remoting的体系结构,提出基于NET Remoting的分布式异构数据库一站式检索系统模型,并对该模型的实现过程进行详细论述。
介绍几种常见的分词算法,在改进传统的反序词典、优化逆向最大匹配算法的基础上,设计并实现基于逆向最大匹配的中文分词系统,试验证明速度和精度都有显著提高。
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。
以中国生物医学文献数据库部分数据作为语料,通过实验比较几种测量词间相关性的方法在测量关键词与叙词相关性时的准确性,探讨自动构建关键词与叙词对照表的可行性和有效方法。
对20世纪90年代以来国内外网络信息资源评价的相关期刊论文(国外200篇,国内80篇)进行统计分析,得出国内外的网络信息资源评价研究的发展与变化情况,并在此基础上,对未来发展方向进行展望。
介绍LOCKSS系统架构及其长期保存策略,重点分析LOCKSS期刊插件的组成方法、属性定义,并在此基础上,讨论插件类型特征及开发模式,提出中文期刊Plugin的开发原则、策略和实现步骤。
Apriori 算法是关联规则挖掘的一个经典算法,在分析关联规则挖掘算法的基础上,提出利用HASH表技术及减少生成候选集的数量对经典Apriori 算法进行改进,从而提高图书馆数据资源的利用率,加强图书馆个性化服务。
介绍山东大学图书馆开发专用软件,采用跨域名Cookie技术,实现基于Web电子资源校外访问的统一身份认证,替代代理服务器和VPN方式,采用独享带宽的实现方式,解决网络瓶颈问题。
目前市场上推出的图片浏览器不具有图文并茂和声音同步浏览、播放、收藏、自定义等功能;而多媒体计算机辅助教学软件和诸多电子读物又存在用户不能变更内容的缺陷;为满足市场对图片浏览器多功能的需求,提出自定义多媒体图片浏览系统的设计思路及多媒体图片页面制作方法。
以军队院校图书馆信息网络系统(Milins)为研究对象,以第二炮兵工程学院图书馆为实例,采用多维数据模型,运用Microsoft的SQL Server 2000设计实现一个数据仓库。通过“维度的渐变性处理”解决数据仓库“历史数据缓慢变化”的一致性存储问题,同时基于数据仓库得出的“在库复本率”和“借出复本率”是评价图书馆图书利用率的一种新方法。
针对高校图书馆及公共机房管理与维护提出一套切实可行的实施方案。着重讨论Ghost多播服务,Ghost软件包自动分发,利用脚本自动修改机器配置等问题。
介绍图书采购查重统计系统中运用的理论和技术,并对系统的功能进行简介和评价。实践证明,系统能够帮助采购人员在采购过程中即时了解馆藏和借阅信息,对当前的采购数据进行有效决策和处理。
将SPSS和因子分析方法应用于图书馆绩效考核实践,通过对图书馆人员绩效的多标准、多人数的统计分析,不仅实现了绩效排序,还实现了绩效考核等级的划分。对提高图书馆人力资源管理水平起到积极的推动作用。