对本体编辑工具Protégé分析和调用,以从网络内容抽取到的科研实例为分析对象,进行自动构建科研本体、基于科研本体实例进行简单推理的实践,并阐释实践方法,最后指出目前针对大规模本体存储和管理存在的问题。
讨论利用开源的工具软件,搭建能够对中文网络信息资源进行处理的网络信息资源采集与保存平台,并对所进行的专题采集实验进行初步分析和总结。
对以DSpace原型系统为基础构建CAS-IR平台所进行的主要扩展和优化进行概述,主要涉及内容提交和编辑流程、知识组织、传播和服务、知识资产统计、用户管理、用户界面的优化以及面向生产环境的部署等方面的优化、改进或扩展,并对CAS-IR应用部署现状、扩展开发的经验进行简要总结。
简要回顾开源长期保存系统DAITSS的发展概况和基本特点,详细描述其系统功能框架,深入分析DAITSS的数字对象模型和存储管理以及该系统基于格式转换的积极保存策略,并就其在FDA的应用作简单介绍,认为在现有的资源环境中,DAITSS为各保存机构构建一个基于已有资源环境的保存系统提供更多的可能。
基于开源软件组合技术,通过图书馆自动化集成管理系统实现读者借阅历史数据的整理和转换,设计和开发借阅历史记录查询系统,满足读者借阅历史记录查询与保存的个性化需求。
从检索便利性、检索途径、浏览与导航方式、书目信息显示、资源链接类型、用户服务项目等方面入手对我国30所高校图书馆OPAC系统的功能进行调查,分析存在的问题,并提出若干优化对策。
通过对国内外图书馆信息化标准建设情况的评述,对我国图书馆标准化工作现存的差距与面临的问题进行分析,并针对我国图书馆标准技术的研究与开发提出具体的建议。
以本体理论为基础,基于最新推出的ASD S1000D 4.0国际标准对智能化IETM知识库从语义推理和数据存储两方面展开研究,采用Protégé等设计工具实现一个智能化IETM知识库模型,并进行实例验证。
提出一个能对关键词的词意进行分析与扩展的智能模糊搜索模型,并在此基础上实现一个智能模糊搜索系统。本系统以C#语言为基础,在Visual Studio.NET2.0 平台上运用ASP.NET技术,并结合多种脚本语言和Ajax技术来实现。
为了选择最优的边界,采用交叉验证方法,将取得错误率最低的上下文边界确定为上下文最优边界,并应用此方法对SemEval-2007中文数据集进行处理,得出此数据集的上下文最优边界为[-2,+2]。为了验证其结果的有效性,进一步采用SemEval-2007测试集进行消歧测试,结果表明采用交叉验证法确定的最优边界对词义消歧准确率有一定提升。同时对不同词性歧义词的最优边界也进行讨论。
提出结合知网的知识对内部-外部算法予以扩展,并利用扩展的内部-外部算法实现汉语的语义依存分析。实验结果表明,扩展的内部-外部算法克服原有算法的诸多弊病,包括训练代价昂贵、局部极值问题以及与语言学家的分析结果不符等。
针对传统检索方法在当今网络信息环境下所面临的问题,提出基于领域本体的专业文献信息检索模型,就信息组织、查询处理和语义检索过程进行研究,并开发一个基于领域本体的专业文献信息检索原型系统。比较测试表明,基于领域本体的专业文献信息检索不仅具有实现可行性,而且在检索效果上优于传统的检索模式,具有一定的应用前景。
针对Web呼叫中心的排队问题,在分析传统呼叫中心的路由算法和排队策略的基础上,提出适应Web呼叫中心的新客户优先、上次服务和最近最闲分配相结合的路由策略以及一种与平均通话时长、通话次数、等待时间相关的动态优先级排队策略,提高Web呼叫中心的排队效率和服务质量。
在农业实用技术数据库的基础上,通过对自然语言提问理解、修正向量空间模型检索及系统效率优化,在Web环境下开发基于自动问答并辅以专家解答信息服务模式的农业实用技术自动问答系统。系统提问方式简单、回答准确、答案专业、满意度较高,较好地满足农户生产技术需求。
以学前综合教育资源分类为例,联合使用规则和Rocchio两种分类方法,利用建立的新闻规则库识别新闻资源并标注,然后采用Rocchio分类器对剩余资源进行分类。实验结果表明:基于规则和Rocchio分类器的综合分类策略能大大提高综合性资源的分类效果。
以EndNote、NoteExpress为例,分析参考文献管理软件的功能结构、特点及其不足,并在个人信息管理的背景下讨论这类软件在构建个性化和可共享的个人信息环境中的功能,认为它们可以提高用户的信息利用和知识创造的效率,指出参考文献管理软件将会拓展其现有的文献管理功能,向网络化、高度共享、协作化和个性化方向发展。
将心理学、经济学中研究的强化学习模型应用于科技用户对检索方法学习的行为研究中,介绍两个经典强化学习模型Bush-Mosteller模型和Börgers-Sarin 模型;对科技用户信息检索过程中强化学习机理进行剖析,并设计实验室控制实验以运用学习模型对用户的学习行为进行量化分析。实验结果表明:强化学习可以成功反映科技用户对数据库检索方法的学习过程,且Börgers-Sarin 模型能更好地拟合科技用户行为;最后针对数据分析结果对数据库的建设提出策略建议。
综合运用URL聚类、JavaScript脚本解释等技术,自动识别和提取职位列表页中的职位及翻页链接。实验证明上述技术是行之有效的。
通过对各种空间数据挖掘方法的研究,结合GIS技术,设计一个基于GIS的空间数据挖掘模型。深入研究空间关联规则挖掘方法,引入概念格理论,提出一种从GIS中发现空间关联规则的方法。最后采用一个具体实例对方法的实用性进行验证。
根据文献国际交换的业务需求,设计期刊国际交换管理系统。详细介绍该系统以MELINETS期刊子系统为主体框架,通过数据交换和功能集成,对期刊交换实现自动化管理。
介绍采用策略域名解析和反向NAT的技术帮助CASHL系统实现“多网服务”功能的方法和具体配置,使公共网用户也能快捷方便地利用CASHL系统所提供的服务。
对清华大学图书馆捐赠管理及服务系统的需求进行分析,提出整个系统的技术架构,并对该系统关键功能模块的实现进行详细阐述。
分析BALIS馆际互借服务背景状况,论述BALIS系统运行、管理模式及技术框架等问题并对未来发展做进一步探讨。
根据图书馆图书外采业务情况,开发基于智能手机与嵌入式数据库的外采查重系统,介绍Windows Mobile与SQL Server CE相结合的开发步骤,分析系统开发过程中的关键技术,包括智能手机开发方法、SQL Server CE数据库组织、数据同步。
详细介绍国家图书馆西文规范数据库的更新过程,包括国家图书馆西文规范数据库的设置原则以及LC规范数据的合并规则、处理过程和灌入步骤。
分析目前RSS类库的实现技术和不足,利用LINQ技术处理XML的优点,结合RSS 2.0规范,设计RSS 2.0生成与解析的类库,并详细描述类库中各种方法的实现过程。LINQ技术的应用为RSS类库的设计提供一种新的可行性方法。