选取Connotea为研究对象,统计分析标签、被标引资源、标引者两两关联关系,发现标签覆盖资源范围较广,标签共现现象突出,部分用户标引活跃,资源平均标签数较低,用户对内容关注度规律性转移,科研领域的用户比较多地使用规范词。提出增加标引词结构关联和细粒内容定位标引。
分析中国数字图书馆开源软件的本地化现状及应用情况,并探讨开源软件在中国图书馆行业的本地化发展中存在的问题及解决方法。
揭示数据起源的概念和意义,通过建立W7模式标注数据起源,并比较几种常用的描述模型,包括逆SQL语句、时序图、有向图、XML/RDF,以数据起源在生物信息学上的应用举例阐述。
从现有的语义网和本体的相关理论出发,探索基于国防机构与产品本体的构建工具与方法;运用Protégé3.2构建世界国防工业机构与产品本体,并给出该本体的关联可视图。
通过分析数字图书馆资源对外服务的相关网络布局模式和互联网多出口技术,提出利用动态域名技术解决多网络出口数字图书馆资源服务效果的关键技术架构。举例说明在3条网络出口条件下,利用动态域名技术满足读者以最短路由快速访问数字图书馆资源的目标。
匹配是信息集成的核心技术之一。论述基于编辑距离、基于标记以及N元文法等为代表的字符串匹配技术的研究现状,指出其存在的不足并提出改进思路。
将二元语义应用于评价SGML格式化的文件,并引入多粒度的方法,提出一种新的信息检索模型。多粒度方法为各元素设定不同粒度的语言模糊集,使得各推荐系统可以更合理更便捷的给出评价值,二元语义更有利于区分各文件与查询间的相关性大小。该模型的提出有利于提高检索效率。
通过对现有UDDI规范进行扩展,提出一个Web服务信誉度评估模型,通过引入量化的概念,采用客户反馈、主动监视的机制,对UDDI中注册的Web服务信誉度进行动态评估和调整,实现基于信誉度约束的Web服务发现机制。
在分析P2P网络概念和P2P网络信息检索的基本机制的基础上,基于信息检索的一般原理给出P2P网络信息检索的研究模型,并基于该模型从资源定位、检索模型及用户模型3个方面讨论当前P2P网络信息检索的研究现状,展望P2P网络信息检索的发展趋势。
阐述DotNetNuke开源软件的体系结构与特点,提出构建基于Web2.0的知识管理平台的设计思路和技术框架,并重点介绍利用DotNetNuke搭建平台的实现过程,为快速构建基于Web2.0的知识交流与管理平台提供一种可行的方法。
讨论Web1.0条件下的高校可视化网络教学系统的不足之处,简述Web2.0中博客和播客的优势,讲解用它们对现有系统升级的方法。以南京陆军指挥学院的网上可视化教学管理系统为例,阐述整个改造升级过程。
向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决“词中有词”的问题,有利于后续的句法分析。
在分析现有情报分析工具功能的基础上,对情报分析平台进行初步的设计和集成化的研究,针对用户的实际需求,结合现有分析工具,初步构建情报分析的集成化环境,并提出后续需研究和解决的问题。
分析多媒体数据挖掘的需求,介绍常见的多媒体数据挖掘形式及存在问题,针对此类问题探讨基于网格环境下多媒体关联规则数据挖掘方法,该方法是Apriori算法在网格环境下的具体应用。通过实例证明该方法不仅具有经典Apriori算法的准确性,还具备网格的并行挖掘特性,可大大提高数据挖掘的速度及运算效率。
为提高医学文献检索的效率和检索结果输出的有效性,快速客观地为科研人员提供高信度、低冗余的参考文献,实现检索结果按相关度排序输出,就基于向量空间模型的文献相关度计算方案进行探讨,提出基于相关度的医学文献聚类分析和相关度排序。
基于互补结构网络,研究对多智能体代理机制,并编写客户端智能代理软件,初步实现定制下载、智能下载、用户兴趣图谱生成、信息过滤等功能。
ETL需要识别各种异构数据,依据这一需求,设计一种新的数据模型,用以描述并支持所有数据源,并对数据源及目标数据库之间的映射关系的建立进行分析。在此基础之上,对ETL的核心内容——数据源的接入及数据抽取给出具体的实现方法。
对双数组Trie进行改进,设计实现基于三数组Trie索引树原理的汉语词典查询机制,并用递归算法实现构词状态表的自动构建。
针对学位论文模板与在线提交系统分离情况下,学生提交论文重新填写元数据项可能带来的输入错误、与印本不符等问题,介绍从Word文档中提取学位论文元数据集表单,将相应数据项内容传递给本地学位论文在线提交系统的方案,并给出VB.net编写的主要程序代码。
通过对多种载体信息资源MARC的数据分析,归纳总结其MARC数据的不同,并根据不同载体资源MARC字段的特征,设计并实现计算机自动分类,从而提高信息服务的质量。
讨论中国石化地质资料管理系统研究过程中,数据库管理和设计的基本思路。阐述应用Oracle数据库结合全文检索产品TRS进行地质资料管理的主要思想,并展示部分设计界面。通过论述得出该方法是安全、高效的。
针对网络病毒主要传播的网络浏览、电子邮件和网络下载等途径,构建基于Linux系统的HAVP病毒过滤代理服务器,能够有效地阻止网络病毒对图书馆局域网的破坏,提高局域网的安全性能。