采用形式概念分析的方法,对知识集成建模过程进行研究和分析;在此基础上利用本体来描述知识模型,提出基于形式概念分析的知识集成过程模型,并通过实例验证建模过程。结果证明在建模过程中引入FCA可以产生创新知识概念,提高网络资源的查全率;还可以对知识概念异构整合,消除同形异义词,提高网络资源的查准率。
以Web2.0时代信息服务向知识服务转变为背景,结合语义Web技术,对智能语义Wiki做详细的分析研究。首先对语义Wiki特性进行分析,通过调研从标注机制、导航机制和检索机制三个方面展开深入研究,针对有代表性的语义Wiki项目进行比较和分析。
详细统计和分析有标记联合结构的内部语言学和外部语言学特征。内部特征方面主要考察该结构的词性序列分布、短语序列分布;外部特征方面主要考察该结构的句法功能分布和左右边界特征词。这些考察一方面为从量化的角度研究该结构提供相对精确的数据,另一方面为计算机自动识别该结构提供语言学知识。
分析并总结4大类数字图书馆资源,分别是商业数据库资源、Internet网页资源、本地自建特色资源和OAI收割元数据资源,研究不同方式的资源整合技术来实现对这几类资源的整合;在此基础上提供一系列服务,重点对统一检索服务的关键技术进行分析,并详细阐述其实现机理和工作流程。统一检索服务通过数据请求模块获取用户的检索条件实现对资源的检索,通过数据分析抽取模块进行分析抽取并存储检索结果,通过Ajax技术将检索结果动态展示给用户,以达到良好的用户体验。
针对目前电子政务中空间数据集成分析功能研究不足的现状,提出一种有效的空间数据转化集成方法,将地理空间数据、非空间属性数据、空间谓词数据以及电子政务事务数据进行集成,构成面向政务分析的更为全面的数据源。在此基础上,设计多维空间数据模型来集成这些数据源。突破现有GIS查询分析功能,支撑更为复杂的空间数据与非空间数据联动查询的模式。
针对目前信息服务机构只能提供文献的检索服务而不提供表格检索功能这一现状,提出一种基于向量空间模型的表格检索算法,并从表格特征抽取、特征词权值设置、检索结果匹配排序等方面进行讨论,为未来表格检索服务提供一定的理论依据。
自然语言理解是计算语言学及人工智能的一个重要分支,本文阐述了自然语言理解的基本流程、相关技术,重点介绍了Glue semantics 和DRT这两个理论。笔者设计开发了基于Glue semantics 和DRT的语义计算的系统平台。本文对平台的设计思想、具体实现和关键技术进行了详细的介绍,并指出了一些存在的问题。
为解决搜索引擎结果繁杂而导致的浏览性不高的问题,提出一个基于用户行为学习的元搜索框架和结果聚类方法,并加以详细描述。利用该框架与方法,可以实时搜集用户行为进行推理学习,将学习到的有效知识存入知识库用以指导结果聚类,并随着用户的搜索过程不断调整完善。原型系统证明该方法是可行有效的。
提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影响领域术语抽取召回率的同时可以提高抽取术语的正确率。
针对热点主题发现是在聚类算法的基础上实现的特点,将改进后的蚁群聚类算法引入到该研究中,同时提出类别关注度(CAD)的概念,以此来判定类别的热门程度并区分出热门类别和冷门类别,在此基础上抽取热点主题集。实验结果表明改进后的蚁群聚类算法对热点主题的发现有一定的效果,对其他仿生优化聚类算法的引入有借鉴意义。
从理论角度分析基于互信息的特征选择方法的不足,提出一种改进的互信息特征选择方法;针对向量空间模型在文本表示方面的问题,使用类别空间模型将文本表示为矩阵,有效利用文本的类别信息,实现一种基于类别信息的文本分类算法。对中文文本的分类实验结果表明,该文本分类方法具有良好的分类效果。
介绍叙词表编制相关标准,重点分析ISO 25964标准的叙词表数据模型,在此基础上设计叙词表编制系统模型,并实现系统的核心功能。该系统能够改变传统叙词表编制模式,适应网络环境下叙词表编制工作的需求,更好地支持叙词表的数据加工、更新及维护。
概述图书馆RSS技术应用的现状,针对高校重点学科建设问题,提出将高校重点学科资源与图书馆信息推送服务相结合的观点。从设计思路、系统功能、技术实现三个方面介绍基于RSS技术的重点学科信息推送服务系统的实现方法,扩充图书馆RSS的应用形式,提高图书馆资源的利用率。
采用开源软件Lucene、IKAnalyzer、Luke进行中文学术文献计量软件的开发实践。介绍该软件的实现框架、数据准备、索引建立、自定义SemicolonAnalyzer分析器中的关键实现代码,并对该软件的不同计量效果进行分析。研究的主要目的是利用开源软件降低计量软件开发的复杂度,为研究人员提供一种自行开发中文学术文献计量软件的可行方法。
介绍图书馆电子资源OpenSearch插件的开发,较好地实现图书馆资源与用户的浏览环境和检索习惯的集成融汇,满足用户方便、快捷、高效地利用资源的需求。