回顾CSDL对于科技期刊资源建设和所提供的服务,分析期刊系统整合与服务集成目前所面临的问题,在参考国外相关机构的解决方案后,结合CSDL的现状和发展需求,提出建设和实现情景敏感的集成期刊服务系统,介绍集成期刊服务系统的建设目标和思路,详细描述基于知识库的情景敏感的系统设计和系统实现,最后总结目前存在的问题和可能发展。
通过对数字图书馆的日志记录现状进行分析,找到目前存在的问题,进而提出基于XML的用户日志格式,并将该日志格式应用于实验系统,通过用户使用该实验系统收集一定量的用户行为数据。
分析使用NXD数据库对比传统关系型数据库进行存储优势,提出用NXD数据库对DC元数据存储,并设计一个原型系统实现DC元数据的存储和利用。
通过对当前一些主流本体推理机详细的分析研究,得出本体推理机的一般系统结构,在介绍三个典型的推理机系统(Pellet, Racer, FaCT++)后,从系统功能,用户和开发者三个不同角度设计并实现一套比较不同本体推理机的测试方案,实验证明测试方案是可行有效的,最后总结当前本体推理机存在的一些问题和未来发展趋势。
主要介绍基于知识组织的“中国科学院学位论文应用系统”的设计与实现,通过构建学位论文的实用分类体系,主要完成了系统的功能分析和用户界面设计,并提出了系统可行性实施方案。
提出基于本体的知识组织方式的中国艾滋病信息门户(CAIP)建设方案,对艾滋病领域的文献信息、项目信息、机构信息、专家信息进行组织整合并提供便捷的关联检索功能。重点介绍CAIP中各类信息及其相互之间关系的组织方式以及利用Protégé软件实现的方法。
主要介绍“疾病/诊断领域数字资源整合智能检索系统”的项目设计与实现,通过疾病/诊断领域的实用知识分类系统Ontology的构建和应用,为智能和整合检索提供知识描述和组织基础,通过用户研究和典型任务分析,介绍面向智能检索服务的信息可视化在用户界面设计中的应用。
对当前信息检索系统存在的问题进行分析,明确智能信息检索迫切需要解决的问题;在对现有的智能信息检索模型比较分析的基础上,提出基于知识空间的智能信息检索模型——知识空间模型,并描述基于知识空间的智能信息检索模型的框架、体系结构及其中若干关键问题。
提出一个Ontology与CBR集成的Web智能信息检索框架,该框架利用Ontology对Web页面进行语义标注、设计案例库,并利用CBR的推理能力对Web页面进行基于内容的推理分析。以旅游为示例,给出系统实现方案。
以农业古籍本体的构建为例,从数据选择、构建方法、总体设计几个方面探讨领域本体构建流程。同时采用Jena实现了对该本体的可视化浏览以及基于自然语言的语义检索。
针对目前搜索引擎返回结果的海量性,构建一个元搜索引擎,旨在高效利用多个成员搜索引擎返回的结果。介绍元搜索引擎的基本架构及当前结果融合的主要方法,应用统计学方法研究网页标题、网页摘要与网页文本之间的相关性关系,从而确定相关度权值进行结果相关性判断。实验证明,元搜索引擎搜索结果的平均准确率比各个成员引擎的搜索结果平均准确率都有较大提高。
用形式概念分析的方法,对用户的搜索结果进行自动分类研究,经过建立模型进行实验证明,用形式概念的方式可以对搜索结果进行自动分类,用户可以更便利更准确地使用搜索结果,有效提高查找信息效率。
引入移动Agent技术,提出一种面向E-Learning的集成群Agent与Web服务的分布式智能推荐系统模型,其能有效地帮助学员找到所需的信息。构造MASWSIRS的体系结构,说明系统的工作流程;详细阐述了MASWSIRS的各主要功能模块的实现算法,包括系统整体实现算法、系统聚簇算法及推荐算法。
分析Web页面的主题特征,构建基于主题的竞争情报采集模型的框架,详细论述面向主题的信息采集策略和采集流程,进而探讨影响信息采集质量的关键因素。
基于Web2.0环境下的维客现象,结合维客技术来描述知识的创作过程,并利用布鲁克斯方程来分析信息与知识的区别,对知识的创造与知识创新进行系统分析。针对维客也有被滥用的可能,提出一些消除网络负面影响的对策。
通过对现行图书馆RFID-UID应用模式和商业物流RFID-UID标准的对比分析及与ISBN的关系,提出了书馆行业RFID-UID的编码方案。
结合图书馆MIS软件的特点,对RUP和UML提供的的统一开发框架和模型描述语言进行实用化定制,总结出在图书馆领域软件开发中运用RUP和UML进行建模和开发的过程,通过一个B/S结构的图书馆信息管理系统开发实例验证了这个过程的实用性,并将其应用到基于中文叙词表的本体知识库共建共享系统(国家社科基金项目)的研究开发中。
研究用病案首页数据,分别以统计方法进行判别分析和数据挖掘方法建立决策树模型,在分类符合率、准确度、精度等方面进行比较分析,结果表明决策树占有明显的优势。
以Web应用系统中对图片尺寸大小的需求,提出一种用Visual Basic创建ActiveX DLL组件实现获取图片尺寸大小的Web应用方法。详细介绍这一服务器端组件的创建方法和步骤,并给出具体程序代码。
采用Web文本自动聚类技术,提出一种将HAC(Hierarchical Agglomerative Clustering)聚类算法与K-Means聚类算法相结合的两阶段文本聚类框架,并通过实验对该框架进行评估。
清华大学图书馆查新工作站通过总结查新工作中的规律和经验, 把计算机辅助技术引入到查新工作的具体处理流程之中, 编制了专用的查新辅助软件WordSnap,辅助查新员在查新过程中进行不同数据库中检索式转换、科技查新附件的内容检查和格式整理。该辅助软件使查新员将更多时间与精力放在提高查新质量上,降低了查新员的非技术工作强度,提高了查新工作的工作效率。