全面介绍国外数字图书馆系统开源软件的研究现状,包括对开源系统软件的扩展与改进、多种开源软件的结合以及开源软件与其他技术的结合。
概述国内外领域本体构建方法及本体进化的研究现状;介绍以《中国分类主题词表》为基础构建“经济学领域本体”初始版本的基本过程,阐述经济学领域本体进化的基本设想,以及具体进化过程及方法,包括获取进化实验数据集,抽取候选关键词,获得本体新概念,建立概念关联等。
在对开源软件DSpace系统进行简单介绍的基础上,以厦门大学运用DSpace系统构建机构仓储为例,对DSpace系统中的几个主要有关界面显示的系统文件进行中文化处理,同时对系统的界面与功能进行调整和优化,另外对系统运行所需的邮件服务器也作了一些改进,从而使其更符合国内有关机构或单位的实际应用需求和用户使用习惯。
提出基于OAI-PMH协议的数字档案馆互操作的框架及功能,分析数字档案元数据EAD的结构及其与DC的映射,讨论EAD记录向OAI转换的技术原理,尤其是关于转换后保持记录上下文关系的原理,针对转换过程中存在的问题与困难提出几点解决办法。
针对个性化推荐服务的需要以及用户聚类处理时用户-文档访问数据的高维稀疏性问题,采用“比对降维”的思想和K层次聚类算法,分析基于用户资源评价数据的用户聚类处理流程。在此基础上,采用Java开源技术设计并实现一个用户聚类的试验系统。
知识组织系统的互操作是实现跨库浏览与检索的关键技术之一。介绍知识组织系统互操作计划,总结采用的方法,对三个具体互操作实例进行分析,并对实现我国知识组织系统的互操作提出建议。
研究本体支持下的智能检索问题。利用语义的层次结构和蕴涵关联量化领域概念的关联程度实现查询扩展,并采用RDF的三元组方式规范检索关键词,依据本体中的关联重构用户查询需求,以匹配策略实现智能检索。经过实例计算与分析,验证该方法的合理性,可行性及特点。
探讨一种新的文档分类方法——基于本体的规则分类法。该方法首先根据分类体系建立每个类的本体,然后根据本体和规则对网页的主要标记信息进行分类。实验表明,这种方法比Rocchio分类法查全率略低,但查准率较高。
对中文时间词和数词在文本中的常见形式进行归纳,以此为基础构建用于识别时间词、数词的规则集,提出一个基于规则的时间词和数词自动识别算法,并对该算法在竞争情报分析领域和机器翻译领域中的应用价值进行论述。
形式概念分析和领域本体是两种形式化方法,其目标都是构建概念的模型。提出一种计算FCA中的概念语义相似度的方法,实验结果表明,该方法对概念语义相似度计算是有效的。
提出一种基于WordNet自动构建语义分布词典的方法。在介绍WordNet系统和Semcor语料库的基础上,设计语义分布词典的结构。分析Sense.idx文件和Taglist文件内容,详细描述以它们为基础自动构建语义分布词典的过程。
在信息构建和可用性定义和关系的基础上,结合调查的16所国内较大的公共图书馆网站信息构建中存在的可用性问题,尝试性地建立一套适用于公共图书馆网站可用性评价的指标体系,并对上海图书馆网站信息构建的可用性进行实证分析和评价。
概述Ajax和RSS的定义和特点等内容,重点阐述它们在清华大学图书馆个性化门户网站建设中的应用。
简单分析网页数据的特点,并针对网页数据的特点设计统计分析的预处理流程,对每一步处理过程都用几种不同的算法进行实验,以期得到最优的解决方案。实验证明,通过减少IO操作、提高处理粒度、适当使用词表等方法可以提高程序运行速度与准确率。
针对目前OPAC检索机缺少专有的系统运行环境,提出一种利用开源软件构建OPAC检索机的解决方案。区别于传统的基于Windows的OPAC检索机解决方案,采用完全免费、标准开放的开源软件构建,不仅减少系统的投入,而且具有高效、稳定、安全、易维护的特点。
提出一种新的音乐旋律提取方法。该方法通过顺序扫描音名序列,探测音高变化,从而发现音符的边界,实现音符的分割。对1000首左右用电子键盘弹奏的中国民族音乐的乐曲进行自动分析,旋律提取的准确率超过90%。
针对学位论文数据库回溯建库过程中出现的数据结构不同、数据格式不统一、数据不规范的问题,结合本馆合并两个不同数据结构的TRS博硕士论文数据库的经验,介绍利用WORD的VBA解决问题的方案,并给出程序代码。
介绍指纹技术的原理及特点,设计和实现基于指纹技术的读者证件系统,对图书馆目前使用指纹技术尚需解决的成本问题、隐私问题、指纹采集和比对问题进行探讨。
通过对ALEPH 500系统采访模块的应用描述和分析,对采访模块的功能和特点以及四川大学图书馆本地化开发与应用情况进行概括,并对该系统采访模块目前存在的问题进行研究和讨论。
结合利用内容管理技术,从方便学籍档案远程应用的角度,提出一个高校学籍档案管理系统的设计方案,并通过IBM 的内容管理中间件产品Content Manager v8.3实现一个原型系统。