回顾网络信息资源保存的发展历史,分析网络信息资源保存在初始实验、应用部署和长远发展这三个阶段中的不同进展和特点,通过总结网络信息资源保存的研究历程和近年来国内外实践,初步预见未来趋势展望网络信息资源保存发展趋势,以期对我国网络信息资源保存起到参考作用。
通过总结目前国际上Web Archive中常用的三种采集策略:完整性采集、选择性采集和混合型采集,对比分析各种采集策略的特点、关键问题和代表性的项目,最后分析选择采集策略需要考虑的关键因素,并提出一般性的建议。
选择Web Archive有效存档研究中几种典型的存档策略:基于外部索引的压缩存档、基于多文件服务的存档、基于格式迁移的存档、基于特征抽取的存档,对它们的保存背景、策略应用以及实现特点进行分析,希望为我国在Web Archive存档研究的发展提供一些参考。
以现有Web Archive项目为案例,初步分析这些项目中所采用的检索系统架构以及它们如何应对在海量数据中快速发现信息、呈现信息的挑战,以期从系统架构的角度来探析Web Archive检索系统的性能和效率,为相关研究机构、人员提供参考。
介绍Web archive资源应用的基本情况,从数据挖掘的角度,对Web archive资源的深层次应用进行总结和分析。
分析Mashup的三层体系架构,并从资源获取技术、表示层组件技术、服务器技术、融汇组织技术几个方面归纳并详细论述Mashup相关技术。资源获取技术从Web Feed方式、公共接口API方式、REST协议方式和屏幕抓取4个方面介绍;表示层组件分为Portlet与Widget两类;服务器技术以Kapow Mashup Server为例;融汇组织技术方面侧重融汇模式和编程语言及工具。最后指出目前存在的问题及未来的研究方向。
以中国科学院部分研究所、国内部分高校的科研人员、图书信息人员、决策管理人员为调查对象,分析不同角色人员对IR的认知和需求差异,揭示国内IR规划实施过程中存在的问题,以期为国内科研机构、高校IR的规划实施提供借鉴。
介绍本体在知识检索中的作用,对语义网规则语言(SWRL)和Protégé-OWL API的使用进行详细介绍,利用Protégé-OWL API和SWRL实现本体概念的推理操作。通过领域本体进行实验,对结果进行分析,为进一步应用提供参考。
针对网络中存在的不同结构化程度的数据,探讨目前用于实现语义网的各种常见本体学习技术、方法及其可获得的本体元素、存在的问题,比较当前融合多种本体学习技术的本体学习系统,分析所采用的关键技术、适用的处理对象以及生成的结果描述。
分析信息觅食理论相对于传统信息检索理论和用户行为分析理论的优势,综述信息觅食理论基本概念、基本模型,系统介绍具体研究内容及进展,结论指出需进一步研究的问题。
针对目前电子商务推荐系统不能很好地为未注册用户服务的问题,根据未注册用户和注册用户各自特点采用两套不同的数据收集方案,以提高网站的友好性与数据的准确性。在推荐算法方面,由于决策树归纳算法与贝叶斯网络算法各有优劣,故将两种算法结合使用,并引入基于内容的算法思想对商品的各属性进行研究,以提高推荐的准确性。实验证明:上述方法能够很好地为未注册用户服务且基于混合算法的推荐优于基于单种算法的推荐。
梳理商业性电子资源管理系统(ERMS)的发展,介绍其应用概况并总结系统的核心功能,重点对比分析和评价其中三种商业性ERMS的实际应用情况,并指出我国图书馆在引进和实施商业性ERMS的过程中所要注意的基本问题。
介绍短信发送服务在清华大学图书馆流通领域的应用,详细说明短信内容提取子系统和短信发送子系统的设计和实现方案。
基于Struts设计模式以及Web Services技术,提出与系统无关、与平台无关、与终端无关的通用手机图书馆系统的体系结构设计与解决方案。阐述通用手机图书馆系统的设计思想、开发框架、主要功能模块及关键技术的设计与实现。
对基于门禁系统和集成管理系统的中间数据同步系统进行研究和分析提出设计与实现方法。该系统实现门禁系统与集成管理系统之间读者数据的同步跟踪,解决门禁系统中存在的读者信息滞后、增删读者困难等问题,方便读者及时进出,提高效率。