首先对文本聚类结果描述的研究背景和相关的研究情况进行说明,分析自动标引、自动文摘、概念聚类与文本聚类结果描述的关系,定位文本聚类结果描述的研究内容;然后根据文本聚类结果描述的具体要求,对该问题进行形式化;最后给出文本聚类结果描述的评价方法。
以协作标注系统为研究对象,从理论研究、实证研究和试验与应用研究三个层面对此领域的研究文献进行综述。最后,对本文工作进行总结,对协作标注系统的未来研究发展进行展望。
提出一种本体集成方法WCONS+,将本体集成过程分为准备、映射、集成和检测4个阶段,并通过集成军用飞机本体和电子对抗装备本体对这一方法进行了实验,结果初步证明该方法的有效性。
采用知识工程的方法,对“新能源汽车”中文专利摘要进行研究分析,提出了一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则,并利用这些规则对专利摘要进行知识抽取结果,抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库的进行尝试,验证了基于本体对专利摘要进行知识抽取的可行性。
介绍一种由若干温度数据采集子站和数据监控中心站构成,并利用微功率无线数传模块FC-210S进行实时数据传送的分布式图书馆温度监控系统。详细介绍系统构成、软硬件设计方法。经实测,该系统对系统温度检测误差低于±0.1℃,可设置临界温度警报,并可对历史数据进行回溯,为日后制定图书馆温度控制方案提供依据。
e-Science,即“数字科研”,是建立在网格技术基础之上的一种全新的科学研究环境。分析e-Science环境下数据资源的新变化,并简要介绍e-Science环境下的封装科学数据、计算资源、工作流和起源元数据等各种数据资源的复合数字对象研究进展。
为使领域本体利用顶级本体中的常识知识进行有效的推理,开展将OWL Full表示的顶级本体SUMO和OpenCyc转换为由OWL DL表示的研究,在尽可能保持原逻辑关系的前提下,针对类、属性及实例的定义在转换中出现的各种问题进行了相应的处理,使转换后的顶级本体符合OWL DL语言标准。
在传统可用性评价理论的基础上,提出适合于数据库检索系统的新型可用性评价指标集:可理解性、可操作性、信息获取度、信息辨别度、出错频率、交互效率和用户主观满意度。采用总结性测试方法对中国科学引文数据库(CSCD)进行可用性测试,验证可用性评价指标集的适用性。最后分析测试结果以及产生问题的原因,提出进一步完善系统可用性的建议。
采用基于条件随机场的方法,对ACE评测的英文语料中的地理行政类型实体(Geographical Political Entities, GPE)及其子类型进行识别。提出一种从ACE语料中选取的特征集,并根据不同的特征组合对GPE识别的贡献与其它特征集进行比较,实验表明该特征集能取得较高的召回率和准确率。
提出基于认知风格模型的检索界面设计原则,以搜索引擎Google作为实验对象,基于认知风格理论,从界面整体风格、主目录和子目录排列方式、命中网站的排序方式、检索结果的表示方式及相关目录显示5个方面分析Google检索界面并提出相应的优化策略。
首先概述垂直搜索引擎的有关研究,结合通用搜索引擎分析垂直搜索引擎的一些特点和应用,然后结合实际的开发应用从提高查准率、提高查询速度、提高信息采集效率、控制信息采集质量等角度进行分析和探讨,在实例探讨中结合12580网络信息采集的餐饮垂直搜索原型系统提出信息采集、信息更新、信息抽取等实际应用领域中的若干策略。
构建企业信息系统用户接受概念模型,并以ERP系统作为企业信息系统为例进行实证研究,采用结构方程分析方法对概念模型中结构变量间的关系假设进行验证。研究结果表明,模型中提出的多数变量对持续使用意图具有直接或间接影响,对于了解企业信息系统使用中的用户行为作用具有重要意义。
介绍链接分析技术和可视化技术,讨论可视化技术在链接分析中应用的国内外发展现状、步骤和方法,对几个典型的可视化检索系统和链接分析工具中可视化链接分析的应用实例进行较细致地分析。最后,分析不足及未来可能的研究方向和可用的方法与技术,为开发功能强大的可视化链接分析工具提供支持。
利用正则表达式在字符串操作上的优势,实现从不规则含噪页面中对油价事件信息的抓取,指出实现中的难点要点,并验证正则表达式在字符串处理中强大的结构描述能力。
针对跨语言信息检索的查询翻译歧义性问题,采用交互式系统开发设计方法,对基于相关反馈的跨语言信息检索技术进行研究和分析,提出一个英汉交互式跨语言信息检索系统,实现用户辅助查询翻译、多级用户相关性判断,以及翻译优化与查询扩展等相关反馈功能,结果明显提高了检索效果。
针对数字图书馆建设面临的信息安全问题,分析基于B/S结构的可视化网络行为安全审计系统的体系结构,并重点设计、实现安全审计系统的基于Spring+Struts框架的Web应用和可视化网络行为审计功能。系统的应用能够控制用户行为和进行事后审计,为维护数字图书馆系统的安全提供保障。
在分析PDF文件结构的基础上,解析PDF文件的内容流,并采用基于规则的匹配方法和基于格式的定位方法,自动抽取科技论文中的语义元数据信息。实验结果表明,上述方法对标题、作者等重要的语义元数据信息能够达到较好的抽取效果。
分析在图书馆特色信息服务中Mashup应用的必要性,针对双层增值指出现有Mashup应用的不足。以服务增值为原则,开发出一种图书馆推荐书目与书评信息的专业应用方案。