基于美国国家科学基金会于2003年6月召开的后数字图书馆未来研讨会的成果,分析美国数字图书馆发展10年来的成绩与问题,探讨后数字图书馆时代的研究目标与方向。
从系统建设、数据处理、版权保护、存档与备份等角度,介绍清华大学图书馆学位论文全文数据库的建设实践,并在此基础上,对高校学位论文全文数据库建设提出一些建议。
借鉴元搜索引擎的原理,设计一个基于Multi-Agent的跨库检索系统。利用界面Agent、协作Agent、汇总Agent和检索代理Agent来实现系统的智能部件,多个Agent之间的通信通过协作Agent进行协作和交互,共同完成检索任务。同时对跨库检索系统的关键技术进行研究和讨论。
提出一种汉语分词算法,在给定的分词词表的基础上进行汉语分词时,不但能成功切分出分词词表中已有的词,而且能同时自动识别出分词词表中没有的词,即未登录词。与逆向最长匹配法以及其他未登录词识别算法进行的测试比较表明,该分词算法可以有效地解决大多数未登录词的识别问题,并且能减少分词错误,同时对分词算法的效率基本没有影响。
研究开发一个基于语义Web的教研辅助系统平台,提出以教育部颁发的《普通高等学校本科专业目录》中设立的学科体系为知识框架,以Web本体语言OWL为表示语言的知识表示方法,将知识资源分为13类,并对不同类型知识的表示加以区别。给出一个实例简单说明这种表示方法的具体实现。
分析跨语言信息检索技术的翻译歧异性问题,指出多语本体的引入可以提高语义排歧的准确性,详细分析两个国外的跨语言信息检索系统,并在此基础上提出一个基于双语本体的中英跨语言信息检索模型及实现方案。
针对搜索引擎在信息检索过程中存在的局限性,提出基于本体的多Agent智能检索系统模型,给出模型的体系结构、工作流程和功能描述。系统中智能Agent借助本体知识对检索请求信息进行规范化描述,以提高检索的准确率和覆盖率;各个Agent分工协作完成信息检索与自动更新服务,体现系统的智能化与个性化等特点,为实现高效智能检索系统的研究奠定基础。
介绍感性工学的产生背景,主要研究内容与实现原理,并结合图像检索问题,分析感性工学与图像检索的联系以及基于感性特征检索图像的系统架构。指出感性工学和基于感性特征检索图像研究中有待解决的问题。
对遥感图像检索中基于贝叶斯定理的一系列处理方法进行研究,阐述如何在底层原始图像特征与高层语义图像特征之间建立映射,并利用贝叶斯网络进行交互学习和概率检索的方法。最后结合基于内容的图像检索技术的研究热点,将Ontology概念引入图像检索领域,以提高图像的高层语义检索的精度。
介绍一种专为个人用户量身订做的搜索引擎,它使用启发式实时搜索算法,为用户提供最新的主题相关信息。该系统能够结合用户需求,很好地解决综合性搜索引擎中普遍存在的主题固化、信息滞后等问题,同时为搜索引擎的个人化提供理论和实践依据。
提出一种基于遗传算法和k-medoids算法的新的聚类算法。指出该算法除能提高聚类的精度和识别孤立点外,还能加速遗传算法的收敛速度,节约时间成本。
基于有限状态自动机,提出一种新型的有限自动机模型——模式自动机,并以该模型为基础,设计出一种新的汉语自动分词模型,给出构造汉语自动分词模型的核心数据结构和构造算法,并分析该分词算法的复杂度。
针对当前教学资源系统存在的信息孤岛和紧耦合集成等问题,从Web服务栈结构的特性和应用模型的特点出发,描述动态教学环境下教学资源系统支持共享与协同的功能结构,并阐述基于Web Service的软件集成技术,给出一种基于服务网格的教学资源系统集成框架。
对网络资源评价指标相关文献的内容进行调研,初步拟定指标体系,并通过调查表的方法初步评价该体系。应用人工神经网络软件及统计学方法处理调查表数据,对网络资源评价指标中词频赋权的意义进行研究和分析,实现网络资源一级评价指标体系的重构。
分析Web日志挖掘在图书馆中的应用,提出一种利用SQL Server 2005数据挖掘平台构建日志挖掘系统的方法,详细介绍系统主要组件的功能和实现方法,并给出相应的系统框架设计图,最后论述此设计的优点。
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。
借用信息系统的开发思想,将伙伴选择分为资质、核心、预期三个选择阶段。构建伙伴选择评价信息系统的总体结构,并提出潜在伙伴的搜索与注册功能模型。
介绍分布式数据库中两种主要的死锁模型,分析4种分布式死锁检测算法的特点,并在此基础上提出一种改进的死锁检测方法,即运用动态创建DDA(死锁检测代理)的方法。该算法吸收已有的死锁检测算法的优点,而又避免其缺点,能很好地适应分布式数据库系统的需要。
运用有限状态图设计图书馆语音自动应答系统, 以弥补图书馆现有系统的不足,实现以读者为中心的新型信息服务模式,使图书馆的信息服务在广度、深度、效率等方面都有较大的提高。
图书馆图书验收工作是一项复杂又繁琐的工作。以书商提供的到馆图书电子清单为验收源, 设计和开发出一种新型的图书自动验收模型,使图书验收工作更加自动化。这种验收流程不仅可省去人工验收需要核对并修正书名、著者、定价的过程,同样还可省去录入到货数量的步骤。
在图书编目工作中,通用汉语著者号一直深受广大图书管理人员及读者的欢迎,这主要是因为该编制方法在书次号中相对科学。由于延续至今的著者号查号法有严格的编制规则,故使用上相对繁琐,编制效率不高。针对这一问题,提出一种利用计算机来自动完成这项工作的方法,从而使这一编制工作变得简单快捷,准确而高效。
在研究海洋生物分类的基础上,应用现代信息管理的理论基础和具体技术,提出以海洋生物图像信息处理为主的系统组织方式,着重探讨系统规范化设计、分类与标注方法以及海洋生物图片检索的方法。
研究自动抽题组卷系统的策略,重点探讨试题库的构造和抽题组卷策略,提出动态配置组卷参数的算法和随机组卷算法模型。详细介绍试题库子系统、抽题组卷子系统、编制试卷子系统的主要功能,以及基于Visual C++ 6.0的相应的接口。