系统而全面地回顾iPRES2007数字资源长期保存国际会议,从数字资源长期保存的战略计划与基础设施、相关管理问题、技术研究与实践、认证与评估、教育与培训5个方面介绍研究和实践的进展情况,深入分析并总结已有的经验和教训,并就面临的问题和下一步发展进行探讨。
基于Struts+Ajax的学位论文管理与服务系统是集论文提交、管理、OAI服务为一体的系统,能满足大多数高校对学位论文的处理要求。系统在技术实现上采用Struts开发模式,同时结合目前广泛应用的Ajax开发框架——Prototype。结合Struts和Prototype来阐述基于Struts+Ajax的学位论文管理与服务系统的实现。
介绍OAI协议和开源软件ARC,在此基础上阐述基于OAI的收割和服务系统的设计思路和框架,以及系统的实现和测试结果,最后分析系统与开源软件以及Java国际化的一些问题。主要从系统结构、实现的理论技术和功能上进行分析和研究。
基于Struts-Hibernate设计模式以及Ajax技术,提出统一检索与服务扩展系统的结构设计与解决方案。主要阐述系统轻量级架构的设计思想、程序流程以及系统主要模块的设计与实现。
在Web2.0环境下需要对数字图书馆门户集成做进一步提升,从数据集成、管理集成和服务集成3个方面进行阐述。数据集成包含本地自建资源、外购商业资源和网络免费资源3种;管理集成包含权限管理、采集服务管理和OAI/METS服务管理;服务集成包含统一认证、统一检索、资源导航、OAI/METS数据提供方和RSS订阅,并着重分析使用的Web2.0开源软件和Ajax技术,最后给出相关应用实例。
阐述各种类型的本体异质问题,明确本体匹配的概念及与本体映射的关系。在总结本体匹配主要理论的基础上,初步确立本体匹配基本理论框架,包括匹配粒度、匹配参数、匹配操作、匹配策略及匹配过程等内容,较为全面地阐述本体匹配的基本理论体系。
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。
针对人工进行不同文章中相同内容的判断存在着较大困难的局面,提出一个基于句子匹配的文章自写度测评系统。设计基于句子匹配的文章自写度测评系统的系统结构,论述句子分析器、句子匹配器与文章自写度评价器3个关键模块的详细流程,并设计相应算法。选取小规模数据进行实验,实验结果表明,基于句子匹配的文章自写度测评系统从技术上完全可行。最后分析基于句子匹配的文章自写度测评系统的难点及问题。
提出一种基于RSS的博客采集系统实现方案。设计两个爬虫,一个负责广度优先遍历互联网,获取每个用户对应的RSS地址;另一个负责对每个RSS地址垂直搜索,跟踪检测是否有更新的博客文章,以增量方式将更新文章装入数据库。并为算法设计实现一个模型系统。
提出面向用户的信息系统界面设计方法,设计一个面向用户的可视化界面开发环境,并详细介绍面向用户界面设计方法的基本原理。通过该方法在一个国际货运单证管理信息系统中的应用说明,系统能较好地满足用户个性化和多变的业务需求,且使用简单。
在智能多Agent系统(Multi-Agent)以及黑板协作机制的基础上,对用户Agent进行改进,并以此为核心,开发一种基于用户Agent的多介质知识源下的个性化信息检索系统。提出整个系统的框架结构,分析用户Agent黑板结构分区及数据格式,并给出任务分解、任务分区信息、通信信息分区的组织及监控机制的实现,最后对多Agent系统的协作机制进行讨论。
在讨论主题搜索引擎发展缘起、基本原理及体系结构之后,对开源搜索引擎WebSPHINX的功能特点进行分析,并在此基础上自行设计一个基于WebSPHINX的主题搜索引擎。
提出一种基于句子相似度的文档复制检测技术,在抓住文档的全局特征的同时又兼顾文档的结构信息,克服以往检测算法两者不可兼顾的缺陷,提高检测精度。最后,给出该算法与其他算法检测结果的比较情况。实验证明,该算法是可行的。
介绍情感信息处理的研究背景,阐述其两大研究分支及其研究现状,并从处理过程角度归纳情感信息处理的主要技术,最后指出在图书情报领域应用情感信息处理的重要意义。
简单介绍开源的全文检索系统Solr的起源、功能特点、系统架构与使用方法,然后对分面浏览的定义与当前检索方式相比的优越性进行分析。通过自建的后台服务程序对现有MARC数据进行分析并传递给Solr以生成索引文件,修改Solr的配置完成对现有OPAC系统的改进,提供一种快速高效的分面浏览解决方案。Solr的性能卓越,在百万级的数据量下表现良好,值得推广使用。
从目前数字图书馆的实际困难出发,提出一个依托《军事信息资源分类法》,挖掘人工标引经验,用之于自动分类的方案。
介绍一个基于半B/S模式的Z39.50客户系统的设计方案和具体实现,讨论其中的关键问题,并给出解决办法。系统的成功开发和试运行情况表明,设计方案具有一定的先进性。
通过对高校图书馆办公网络现状的调查研究,发现Cernet与不同网络之间的“互联互通”是影响高校图书馆网络办公效率和资源发布、获取的主要因素,分析利用RouterOS来构建安全畅通的图书馆网络办公系统的可行性。实践表明,该方案具有投资低、效率高、安全性好、配置灵活等优点。
围绕高校图书馆虚拟社区构建中的几个主要问题进行研究,在分析其服务定位的基础上,提出基于兴趣的社区划分方案和实现算法,并就社区生态圈的建立和信息资源共享机制进行探讨。
较全面地讨论商务数据挖掘的系统结构、方法与技术。为了直观、方便地利用商务数据挖掘结果,采用可视化方法是一种优选方案。从商务数据特征值的抽取、处理流程与算法到特征库的建立、降维映射,直至可视化结果的生成都进行详细探讨。