简要介绍数字图书馆中教学参考书系统的应用现状,并就其中数字教学资源分布零散的问题,提出一种通过关键词索引技术,能够对文本教学资源进行检索,然后将相关联的结果聚类重组之后集中呈现的系统。
根据知识网格在描述领域知识概念间各种关系所具有的独特功能,探讨基于本体的知识网格集成服务流程过程中有关语义概念的映射表达,相似度实现算法,并提出具有本体功能的一站式集成服务平台的构想。
采用文献综述、结合标准文献调研与网上调研的方法,对本体技术标准化的研究现状进行分析比较和综述,指出顶级本体、领域本体构建方法,本体管理系统的设计,分词系统以及相关知识库的构建等技术层面的标准仍然十分馈乏;指出本体技术亟待标准化的重要性。
通过利用本体编辑工具Protégé 3.3和KAON,以构建基于医学主题词表(MeSH)的预防医学领域本体为例,从基本信息、本体构建、可视化管理、存储管理以及对语义网支持方面等对两种软件的性能和操作方法进行比较。
主要介绍基于本体的信息检索技术的基本思想,并依据基本思想提出一个系统模型和一种用于提高检索结果和检索目标相关性的算法。
研究在信息资源共享环境下DOI的主要应用,包括基于文献间引用关系的开放知识链接体系的建立,开放获取环境下分布式知识仓储的统一标识,以DOI为纽带的异质科技信息资源的引用和链接,以及基于行业价值链的数字版权管理等。在以上应用的基础上,提出在我国推广DOI应用的价值和远景。
采用人机结合信息筛选方式,对增强学科导航系统的功能进行开发研究。在学科导航建设的多个环节体现人工参与思想的系统开发,为学科导航建设可持续发展提供一种解决思路。
从企业收集、监测互联网信息的实际需求出发,介绍基于Multi-Agent的分布式信息采集系统的结构模型;重点阐述中心控制Agent在组间层次上、调度Agent在组内层次上基于优先级的任务调度算法;为达到系统中运行任务Agent的各节点主机负载均衡,给出调度Agent与任务Agent间的组内协商机制;对系统原型的测试结果表明,基于优先级的负载均衡任务调度模型的正确性与有效性。
综述TAM与TPB、TAM与TRA的整合研究现状,并进行深入剖析,在此基础上,提出基于TAM、TPB以及TRA的整合模型。
在分析现有电子商务购物模式不足的基础上,设计一种基于移动Agent的智能商务系统。它能为客户快捷便利地寻找所需的商品信息,推荐合理的商品,实现客户与商家的双赢。
在知识抽取的分词过程中,需要提前把停用词标引出来。停用词处理的关键在于停用词的认定、停用词表的获取与组织技术以及停用词匹配技术。停用词的识别常常需要停用词表,识别过程中需要判断假停用词以降低噪声。实验表明,对停用词进行单独处理可以大大加快词语切分速度以及后续的句法分析归约速度。
在对Map/Reduce算法进行分析的基础上,利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎,以面对搜索引擎对海量数据的处理和存储问题。
XFML又称为可扩展分面元数据语言,它以分面分类表的形式交换元数据,其基本构造元素是主题或范畴。XFML并不解决所有元数据的需求,它只关注分面分类与标引数据的互换。初步介绍XFML的背景、概念、数据表示方法以及用XFML标引网页的基本原理。指出目前国内对XFML的了解还很少,这一方法的运用将有助于国内网络信息组织的发展。
基于统计的自动分类是网页层次分类中常用的技术,但其有不足之处,主要表现为当子类之间出现严重的特征交叉现象时,分类精确率将大大下降。而网页层次分类的本质决定了同一大类下的子类存在许多相同的特征。针对这一局限性,结合基于规则的自动分类技术的优点,提出一种基于统计-规则方法的网页层次分类技术。实验表明,基于统计-规则方法的网页层次分类技术能够获得比较理想的分类效果。
针对企业文档信息资源丰富而又缺乏有效搜索工具的问题,提出构建企业级搜索引擎。首先分析企业级搜索引擎应具有的功能和总体架构,在实现中,对Lucene索引器进行深入研究;在抓取器的体系设计中,采用插件设计思想,来对不同的文档类型解析、抽取;在任务调度方面,实现一套多任务并行的调度机制;在用户接口设计上,采用Yui-ext组件和DWR远程对象调用框架,实现Web方式下的异步通信,提升用户体验。
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。
简要分析电子白板的相关技术,并对数据共享和JGroups技术进行扼要介绍。在此基础上提出共享电子白板的体系框架,最后给出基于此体系框架的一个电子白板系统的具体实现。
在大规模信息检索领域,随着高速网络技术的迅速发展,分布式并行信息检索技术由于其高效性与经济性而受到越来越多的重视。结合基础教育资源搜索引擎的设计开发,讨论分布式并行信息检索系统中涉及的数据分布、查询任务分解及节点冗余等关键技术。
为了较好地解决基础教育用户搜索教育资源难、不能直接链入基础教育网站等问题,主要研究解决基础教育资源及网站的自动发现和分类等核心技术。提出发现Deep Web的启发式规则及多重特征选择方法。通过该系统将实现基础教育相关资源及网站的自动发现与分类,并以多种分类方式供教育用户检索。
以广州大学图书馆与广州大学城一卡通的系统应用集成为例,介绍在不修改图书馆现有系统的前提下,如何实现与一卡通系统进行集成。简单介绍要解决的问题,重点对所采取的解决方案、在实现过程中所用到的主要技术及关键问题如何实现等几方面进行介绍。