回顾国内外数字图书馆项目的研究和建设情况,深入分析网格应用的发展状况,并探讨现有网格技术在数字图书馆建设领域的运用,总结出未来数字图书馆的发展方向和目前网格技术运用到数字图书馆上所需要解决的问题。
信息网格是网格技术的重要应用模式,本文在分析网格技术的基础上介绍了信息网格的应用背景、定义,讨论了信息网格的关键技术,并详细介绍了信息网格的典型事例——上海网格。
首先设计了科技论文的DTD文档,然后分析了PDF文档的结构。在此基础上, 我们介绍了PDF文档信息抽取系统的设计框架。该框架以上述DTD为模板,把以PDF格式表示的科技论文解析转换为有效的XML文档。
iSCSI是一种新的基于IP的存储协议,试验表明,iSCSI在性能和功能方面已经能够满足数字图书馆存储系统建设的需要,它能够充分利用现有的网络和硬件环境来构建存储区域网络,有效节省成本。
阐述了平台系统的基本组成;论述了平台系统核心技术的数学抽象;提出了LB(Line Basic)语言及面向平台的程序设计思想;介绍了平台语言的设计原理;描述了LB语言的通用指令集;给出了平台系统的五种权限管理策略;通过指令效率分析优化了平台系统,从而通过LB语言将显示模式及众多的内部函数组成一个有机的整体,使平台系统成为集开发与应用为一体的大型软件系统。
在图书馆评价过程中,很多概念既具有模糊性,又具有动态变化性,本文基于动态模糊依赖关系理论,对图书馆的用户评价进行分析研究,提出了动态模糊依赖关系分析评价法,并通过具体的应用实例体现了此评价方法的有效性和可操作性。
通过调查和分析我国图书馆WebPAC的发展现状,对较为常用的几种WebPAC的系统功能、用户接口、标准化设计等方面进行全面分析和比较,总结出WebPAC系统的几个基本评估要素,最后对WebPAC系统的发展提出了几点建议。
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。
主要对基于Web的开放领域问答系统及其涉及的信息检索、信息抽取、自然语言处理等相关技术内容进行了分析研究。提出了系统的一般结构,并对系统中问题分析、信息检索、答案生成各部分功能步骤进行了总结和分析。
针对现有搜索引擎的不足,提出了一个基于P2P的适应性信息检索系统设计方案,详细介绍了系统的各主要模块的功能和技术方法,进而分析了该模型的优势。
对当前网络环境下应用的若干典型的个性化信息检索技术进行了研究和分析。介绍了个性化信息检索的一般模型,从四个不同的角度对各种个性化检索技术做了分类,列举了主要的个性化检索个案,描述了个性化检索系统的核心模块,并简单介绍了如何提高个性化检索的效率。
正确、完整地抽取搜索网页的内容,是对检索到的信息进行处理的基本前提。本文分析了Google网页的结构特征,给出了一组匹配Google网页内容的正则式,并用Visual C# 实现了一个内容抽取器。对多个Google网页的实际应用表明,本文提出的正则式匹配方法可以抽取Google网页的全部主要内容。
针对国内高校数字资源的应用现状进行了分析,对高校数字资源的整合做了探讨,并以国内的DIPS平台和国外的DSpace平台为例在不同领域和层面研究了高校数字资源的整合平台,前者着重于数字资源的加工处理、异构资源的集成和管理、特色专题库的构建和发布,后者着重于数字资源的管理,特别是在存储方面,其先进的构架和预留的二次开发接口为后期的功能扩充奠定了基础。
通过对2000到2003年期刊论文中的Web引文记录的统计分析,提出了引文有效率、年衰减指数和有效性半衰期等指标。基于这些指标,我们对Web资源是否适合学术引用进行了探讨,并得出结论是:在目前这种互联网环境下,鉴于网络的动态性和不稳定性,Web资源的可查证性是有问题的。同时我们还看到,由于网站发布成本下降,Web信息趋于更加不稳定,其可查证性也随之降低。
以图书馆收藏为对象,讨论文献资源的数字加工标准,涉及内容包括文献资源数字加工标准制定和提出的原则,图书馆文献资源类别及特点分析,数字资源文件格式和相关技术说明,在此基础上,重点推荐有关资源的加工级别和发布标准并举例说明。
研究了一种能够实现对数据型网页中信息实施实时采集的信息技术。该技术能够智能识别表格结构,自动分离数据项,在对数据项的分析判断过程中,采用从单词上分类(By Words)和从表格排列方式(By Structure)划分相结合的方法,以Ontology思想为支撑,融合支持向量机算法(SVM)和隐马尔可夫模型(HMM)等一系列成熟模型。最后通过测试并将该技术应用于TBT预警信息动态采集子系统中,收到良好效果。
文章对图书馆在数字版权保护中的权利、义务和法律责任作了论述。
随着网络快速发展,高校中图书馆传统咨询方式受到强烈冲击,为了快捷方便利用图书馆中各种形式资源,数字参考咨询服务应运而生。本文结合高校教师和学生实际需求,从快捷方便解答用户入手,通过校园网络,利用SQL Server 2000和ASP开发工具开发出数字参考咨询系统,投入运行半年来,运行效果良好。
XML文档通常用于数据的描述、存储和交换,缺乏有效的信息查询手段将限制其进一步的应用。本文简介了XML查询语言XQuery,探讨了基于ASP.NET的XQuery处理器网站的功能和实现,描述了.NET平台下XQuery处理器的技术要点和实现代码,给出并分析了XQuery在图书管理中的几个应用实例。
以图书馆自动化管理系统中的Oracle数据库应用为例,从数据库安全的角度出发,介绍了数据库常见的三种备份和恢复方式,并分别对三种备份方式进行了比较。