自由分类法降低了应用元数据的门槛,用户通过平面化的自由关键词进行信息的分类,再以网络共享的方式发布,从而影响信息架构(Information Architecture),便利知识的组织和发现。以美味书签(del.icio.us)、闪亮图片夹(flickr)和维基百科全书(wikipedia)为例讨论自由分类法的优缺点和应用模式。最后指出大众是因特网的主要驱动力,自由分类法技术需根据大众持续变化的需求而调整。
研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率。
随着Internet、Web、网格等网络技术的依次出现,使得网络技术不断发展,所能处理数字资源的能力有了相应的加强,数字图书馆能提供的服务也日新月异。其中网格是近年来兴起的一种前沿信息技术,也是网络技术发展的新趋势;使得各个地域的数字图书馆有可能合并成全球数字图书馆,来统一为用户服务;因此,本文就基于网格技术数字图书馆的服务模式进行了一些探讨:提出了服务的特征和目标、服务的模式、服务的实现等。
对语法开发平台中算法性很强的功能模块进行了算法剖析, 包括句法结构线性表达的分析算法,规则与词典的提取算法,成分结构树图与功能结构集图的生成算法,成分结构与功能结构的转换算法。最后对系统作了简单的功能测试。
作为全球第一个本体服务器,Ontolingua Server有着较好的构建机制。本文详细介绍了Ontolingua Server的构建、维护和应用,以及Ontolingua Server本体库的本体复用机制,分析了Ontolingua的可借鉴点,并与当今的一些本体系统做了对比分析。
随着本体概念的提出,对本体理论及实践的研究探索逐渐开展起来。欧盟IST资助创建的OntoWeb项目对本体的各个方面知识进行了深入地研究,除了研究本体的相关内容,该项目还创建了一个以本体为基础的可浏览的门户。本文详细介绍了这个基础本体的构建、内部的概念和内容类型、可浏览门户的信息提供、对门户的浏览和查询。
选取了国内外10个较有特色的CDRS网络平台,从信息资源建设和咨询业务开展两个方面对它们的建设现状进行了详细的调查和分析,从而为我国CDRS网络平台的构建提出了宝贵的意见。
介绍了斯坦福大学图书馆发起的数字资源持久保存研究项目——LOCKSS系统,讨论了LOCKSS项目的体系结构、系统运行原理、系统技术概况和合作机制等。
通过对基于Folksonomy的数字资源系统del.icio.us和Flickr进行分析和比较,探讨以Folksonomy为信息组织方式的系统的特色、存在的问题以及相应的改进措施。
作为大规模的语义知识资源库,Ontology在信息处理中具有重要的作用。但是,如何有效地构建Ontology却是一个重要的问题。对于自动构建Ontology的过程来说,首要的问题就是如何获取领域概念。本文尝试了一种利用词语共现获取领域概念的方法,用于支持领域Ontology的构建。该方法首先通过人工领域分析,获得起始领域概念,然后利用起始概念从语料库中抽取共现的概念,从而获取相关的概念知识。同时,本文以1998年1月份的人民日报语料库为语料,针对外交和体育两个领域,尝试从中提取相关的概念,从而检验利用词语共现获取领域概念的实际效果。
随着多媒体信息数量的增加,如何对其进行有效的组织利用是我们关注的问题。本文针对音频信息的重要组成部分——语音信息的组织利用,探讨了建立在自动语音识别技术和信息可视化技术基础上的可视化语音检索信息模型。最后文章对现有的两个语音检索系统进行了分析。
通过对传统的基于Web的搜索引擎的工作原理和性能分析、P2P系统的拓扑结构和性能分析以及基于代理的网格搜索引擎的结构和性能分析,探讨了P2P系统与网格系统相融合的可能性,给出了基于P2P技术的网格资源搜索引擎的改进模型。通过评价和分析,证明了它的合理性和高效性。
通过对传统的基于Web的搜索引擎的工作原理和性能分析、P2P系统的拓扑结构和性能分析以及基于代理的网格搜索引擎的结构和性能分析,探讨了P2P系统与网格系统相融合的可能性,给出了基于P2P技术的网格资源搜索引擎的改进模型。通过评价和分析,证明了它的合理性和高效性。
概述了网络个性化导航研究的分类,探讨了如何用半结构时序图模拟用户的导航历史,针对它的不足提出了一个能降低其实现算法时空复杂性的改进图模型。
虚拟参考咨询服务一直是数字图书馆研究中的热点之一,在我国,各类图书馆都在探寻适合自己的参考咨询服务模式,20世纪90年代以来,联合参考咨询逐渐兴起。本文主要介绍了CSDL全院联合参考咨询二期服务系统的概况。主要有:系统架构和组成、服务项目、服务模式和流程等,并探讨了系统目前面临的问题以及发展趋势。
在构建企业网站评价指标体系的基础上,利用模糊层次分析法(FAHP)对选取的三个企业网站进行实证分析,评价了FAHP在企业网站评价中应用的利弊。
介绍了MODS标准,分析MODS与MARC实现互操作的必要性,介绍实现互操作的途径,包括元素集的映射,互操作中间层MARCXML的作用。
结合国内一家工程机械生产企业的客户服务运作的基本数据,进行了实证研究。以系统动力学(SD)概念模型为基础,采用Vensim软件建立了该企业完整的服务系统SD模型,并进行模型真实性检验。基于构建的SD模型,从产品价格信息不对称控制、被动服务信息不对称控制、服务运作策略控制以及信息策略重心调整四个方面进行了模拟研究,研究结果对于实例企业的客户服务运作具有重要的指导意义。
论述了数据备份和容灾的概念、技术、策略,为数字图书馆系统提供了数据备份和容灾的原则、方法和策略,并使用开源软件成功进行了实验。
基于已标注关键词的大规模分类语料库,依据领域专家知识,统计得到词语表征文本内容主题概念的主题度。以此为基础,完成了一个关键词自动标引系统,详细描述了系统实现的总体流程和功能模块。
SciFinder Scholar是美国CAS推出的网络版化学文献数据库,也是目前世界上最大的化学化工资料库。本文详细介绍了该数据库平台的概况、检索方法及特点。