系统而全面地回顾了第6届iPRES(iPRES2009)数字资源长期保存国际会议,围绕“成为主流,保障我们数字化的未来”为主题,会议对保存基础设施、研究数据和工作流、持续性和费用模型、元数据和重要属性、格式、保存实践以及保存案例研究、格式等主题进行深入分析和讨论。强调只有当数字保存真正整合到学术、文化、商业等领域中并成为其业务的有机组成时,才能最终实现长期保存的目标。
对基于平行语料库的双语术语抽取和基于可比语料库的双语术语抽取进行对比分析,说明基于可比语料库的双语术语抽取的研究意义与应用价值。分析总结解决该问题的主要方法及其优化方法,指出存在的问题并展望该研究的未来发展方向。
概述已有的关于语境概念界定的研究,介绍语境研究的4个层次:信息环境层次、信息搜寻层次、信息检索交互层次和查询层次,并对此领域的研究文献进行综述,包括理论研究和应用研究。在此基础上,指出语境研究中存在的问题以及进一步的研究方
在分析国内外研究和实现发现Web页面中最大有意义节点算法的基础上,将多个相似页面压缩成为样式树,通过计算节点的重要性发现最大有意义节点并给出样例分析。
针对用户访问图书馆服务系统需要多次登录造成的不便和负担,着重研究和分析实现单点登录的多种技术方案,在比较商业软件和开源软件优缺点的基础上,结合国家科学图书馆服务系统的现状,选择CAS实现国家科学图书馆的单点登录系统原型,详尽地阐述实现步骤及最后结果,该方案能够给图书馆用户和工作人员访问图书馆众多服务系统带来便利性,为图书馆进一步构建相关单点登录系统提供良好借鉴,具有较高的应用价值。
为了使电子商务网站能够提供基于协同过滤的个性化推荐管理,提出并实现一个电子商务协同过滤原型系统ECRec。该系统包含两个基本算法和4个改进算法,其结构独立于电子商务业务系统,具有良好的可移植性和可维护性;同时内嵌算法接口,具有开放式架构的特征,网站可以根据需要向ECRec中增加更多的协同过滤算法。
针对移动终端设备自身硬件条件的限制,当用户输入的关键词过短时,导致查询结果与查询条件不匹配问题,提出一种相关词共现策略的移动查询扩展方法ALRCO,利用摘要与查询日志中的相关词共现程度来评估扩展词的质量,使得选取的扩展词与初始查询所表征的主题具有更好的相关性。实验结果表明:与传统查询扩展相比,ALRCO能显著提高查询精度,有效提高检索性能。
通过对Web系统性能测试指标和用户访问特征的分析,针对每个特征提出解决方案,在原有Web性能测试模型的基础上,提出一种新的基于Web信息系统的性能测试模型,增加综合性能指标:实际请求时间和请求成功率,改进性能测试流程,并通过实例来验证模型的正确性和有效性。
针对目前学术界抄袭现象日趋严重的问题,提出基于文本结构树的论文复制检测算法。将一篇论文分为三层的结构树:最上层的根节点表示整篇论文,分支节点表示句子包,叶节点表示句子。根据一个函数和句子的综合相似度计算句子相似度,以最大句子相似度计算叶节点相似度,上层节点的相似度由相邻的下层节点相似度计算得到。选用中国期刊全文数据库中的论文进行测试,实验结果证明该算法是可行的、高效的。
基于CNKI收录的11 261篇信息服务方向研究论文的关键词信息,采用共词分析的方法构建一个包含6 401个顶点(关键词)、21 007条边的无向加权网络,验证该网络所具有的小世界和无标度特性。计算网络中节点的点度中心性和中间中心性,并提出一种可用于检测网络中交叉概念的方法。最后,采用边介数(G-N)聚类算法,对国内信息服务研究概念网络进行聚类分析,并划分出7大分支领域。
在充分调研高校实验室信息的基础上,针对总结的实验室信息的规律与特征,制定适合信息抽取的实验室信息描述规则,利用规则进行实验室信息的抽取。设计一个针对高校实验室信息的信息抽取系统labIE,并详细论述labIE的体系结构与技术架构,着重论述网页表格判断规则的设计与特征谓词的构造方法。
针对文本聚类算法在应用方面存在的“维灾”、簇的命名以及大规模的问题,运用WordNet词典进行词列表的降维和词干化,提出并实现基于词性标注和WordNet相结合的并行文本聚类方法,最后和基于Porter词干化的文本聚类方法进行性能的比较。实验结果表明,该方法能大幅度降低词列表的维度,提高聚类的准确率和召回率,同时增强各个簇的可理解性。
以教育部外国教材信息系统为例,介绍清华大学图书馆外教中心在合作共建、资源共享的信息系统方面的工作。从数据规范、系统设计、功能实现、系统特征等方面对平台构建做详细的描述。
针对期刊管理中的现刊订购、记到和装订等各个阶段的工作,从数据的选择、ILAS格式的要求、数据的转换、数据的导入和质量控制等方面,利用现成的外部交接数据与ILAS自动化系统中的内部数据进行转换和合并。在此基础上,实现期刊管理中的各种类型数据处理的流程化和自动化,并对期刊管理自动化系统提出更高的要求。
手机短信服务是数字图书馆中一种新的信息服务方式。以汇文系统为依托,设计实现一个交互式的短信服务平台,解决短信生成、发送、接收、处理等关键技术问题。
根据国家工程技术图书馆文献管理的业务需求,设计长期订单管理系统,分析长期订单文献在采购、到货和价格等方面的特性以及针对这些特点的系统实现方法。按照订单管理、文献(验收/登到)管理和结算管理进行操作流程设计,在数据和功能上与MELINETS充分整合,实现针对长期订单的自动化管理。
介绍科研论文管理系统建设的整体思路和科研论文的数据采集方法,并且详细描述基于DSpace系统建立科研论文管理系统的方法,最后介绍科研论文管理系统的效果和需要进一步改进的工作。