总结数字图书馆领域中与ETL相关的研究,在此基础上提出数字图书馆中ETL的分类,最后结合数字图书馆的应用需求和发展趋势,从ETL在数字图书馆资源建设、数字图书馆用户服务、实现数字图书馆与其他系统之间互操作3个方面,详细分析和研究数字图书馆中ETL的应用方式。
总结可用性内涵,简单介绍国外有关开源机构库软件可用性评估的案例,根据机构库建设的目的和意义,提出一套可用性运用于开源机构库软件评估的方法。
针对当前数字图书馆存在的互操作、资源共建共享、服务器单点失效、负载均衡和知识管理等问题,在深入分析P2P、OAI和主题图技术的基础上,着重在体系结构方面提出一个能够有效解决以上问题的基于OAI和主题图的分布式数字图书馆体系框架。
为了更好地实现科学数据的共享与获取,在研究科技资源数据特点和XML技术的基础上,提出基于多级元数据查询系统的体系架构。重点介绍XML Schema描述的多级元数据结构及其在科技资源数据库查询优化中的应用。研究表明,多级元数据有助于数据查找与定位,使得科技资源数据在科学研究与生产生活中得到更好应用。
在提出网格环境下资源组织结构模型的基础上,构建网格资源服务模型。模型分为3个层次,分别为资源与用户层、服务域层及虚拟组织层。在探讨此模型的功能及特点后,指出今后的研究方向与重点。
针对目前采用关键字匹配实现信息检索的不足,借鉴利用本体进行信息集成的方法提出非结构化对等网的语义检索系统架构,描述各模块的功能,并深入讨论实现语义检索需解决的关键技术——资源描述与提问处理、资源搜索和本体映射等。
针对目前知识组织中存在的问题,将模块化本体引入到知识组织中,提出一个开放的知识组织方法,并分析开放知识组织结构、基本原则、本体模块间语义关系及知识组织算法等。该方法能够将知识分割,将其分配给独立的知识用户,使知识用户能够参与知识的共同构建、维护,从而实现知识的开放组织,在一定程度上降低知识组织的复杂性,提高知识组织的质量和协作能力。
知识表示与匹配推理是语义知识管理的中心环节。为实现文献供应链知识的语义管理,提出文献供应链知识本体模型,以及资源描述框架(RDF)与改进的Voronoi图形式化表示方法;建立了基于RDF形式化表示的定性推理与在此基础上基于改进的Voronoi图形式化表示的定量推理。实验显示,基于形式化表示的推理规则与算法在文献供应链管理中得到合理的结果验证。
在比较HMM和CRFs数学理论的基础上,分别提出基于HMM词角色标注和基于CRFs字角色标注的人名实体抽取模型,并通过开放性测试和实践应用两次验证、比较两者的有效性,从而在实践中证明从理论比较中得出的结论:CRFs较之HMM更适合于解决序列标注或对象分类问题。
阐述Mediawiki的系统构架和特点,通过对Mediawiki的安装、配置、分类体系构建及扩展功能设置的分析,介绍如何利用Mediawiki引擎构建学科信息门户平台。同时以图书馆学、情报学、档案学学科信息门户的设计为实例对有关问题进行说明。
分析学位论文提交与发布系统所需的各功能模块及其结构,以及DSpace开源软件系统的特点和功能;提出利用DSpace构建学位论文提交与发布系统的优势;并介绍在利用DSpace构建学位论文提交与发布系统中的实践工作。
针对大学图书馆OPAC检索机缺少专有的系统运行环境的状况,提出一种基于Windows平台构建OPAC检索机的解决方案。并从系统开发的角度,介绍设计和实现Windows平台上的OPAC检索机所要采取的步骤和方法。
对非可信环境下明文传输登录密码等敏感信息导致的数字图书馆安全登录问题进行分析,提出一个基于单向散列函数的改进方案,应用消息摘要及脚本执行等信息技术,将登录密码这类敏感信息散列为定长且单次有效的“数字指纹”,再送入非可信环境里进行传输,可增强数字图书馆的登录安全。
以著者的四角号码为取号依据,设计编写“汉语著者号自动生成系统”,对该系统测试后发现,编目人员运用此系统可以快速、准确地生成符合成都大学图书馆要求的著者号。
针对数字图书馆资源整合的现状,提出一种自行开发设计的资源整合系统,并以中国海洋大学图书馆为例,将ILASⅡ系统纸质图书信息与方正电子书信息等进行电子信息资源整合开发,采用实体方法和虚拟方法结合的体系结构,基于ASP和SQL Server数据库实现图书馆资源整合系统,很好地满足图书馆各项业务及读者的信息服务需求。