结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。
分析跨语言信息检索的基本模式和翻译消歧关键技术,采用基于词语对共现率和词语间距加权计算的方法,对查询式翻译进行消歧优化,在此基础上构建跨语言商品信息检索系统并应用于图书商品搜索,实验结果证明翻译质量和检索效果得到提高。
基于REST服务和Mashup两种技术,提出一种实现分布式商品信息集成的模型。并以图书商品为例,实现一站式的在线中文图书商品信息查询比价系统,最后验证该模型的可行性和有效性。
提出一种结合语义检索和多属性决策方法的商品信息检索模型。通过构建语义向量空间进行语义相似度计算,以实现检索结果与顾客查询关键词的语义匹配;同时该模型也采用TOPSIS多属性决策方法对检索到的商品进行效用值计算,从而建立商品内容的比较机制。最后,从准确率、顾客接受度等指标通过实验证实该模型的有效性,能够提高商品信息检索的精准度。
以数字图书馆服务组合的结构模型为逻辑起点,分析研究数字图书馆服务发现、匹配及组合的过程,并对基于OWL-S API的数字图书馆服务组合进行应用探索。
介绍DNET的基本功能和特点,明确DNET解决的核心问题:对异构仓储数据的收割聚合、对分布异构的服务调度。通过对DNET信息空间和对象模型、DNET基于服务的架构,尤其对DNET驱动层的剖析,分析DNET如何解决这两个核心问题。并对DNET的适用性、数字仓储联盟建设中的标准化、数字仓储联盟可提供的服务等进行探讨。
探讨Mashup工具的研究现状及功能特点。在介绍Mashup工具相关技术、研究成果及已有分类模型的基础上,提出一个新的分类模型,包括数据层融汇工具、表示层融汇工具及企业级融汇工具,然后分类讨论Mashup工具的主要功能、关键技术及代表产品。
介绍语义集成融汇概念,语义网技术在集成融汇中的作用;总结语义集成融汇关键技术,包括语义化数据描述技术、基于语义的协议规范、基于本体的融汇推理技术三个方面;分析国外主要研究项目,包括KC3 Browser、Bio2RDF、SBWS和Semantic REST等;最后指出如何推动其发展。
在对基于本体的词语语义相似度进行界定的基础上,对基于本体的语义相似度研究进行综述,分别阐述基于距离的语义相似度计算、基于内容的语义相似度计算、基于属性的语义相似度计算和混合式语义相似度计算等算法模型,最后从宏观层面指出今后本领域的研究方向。
首先说明利用加权XML数据模型分别得到标准XML参考实例和XML数据实例的方法,并对DTD约束修饰符的表达方法进行介绍。其次,详细阐述相似度算法的实现方法,重点说明在XML数据实例中寻找与标准XML参考实例的匹配节点算法和计算标准 XML参考实例与XML数据实例的相似度算法。最后,对相关实验及其结论进行总结。
回顾Web服务语义描述的发展过程,详细介绍自OWL-S和WSDL-S之后Web 服务语义描述标准的发展状况,对各种语义描述机制包括SAWSDL、WSMO-Lite以及 RESTfulWeb服务的描述方法SA-REST、hREST、MicroWSMO的特点及应用状况做出研究和评述,并在此基础上分析语义技术在Web上的应用发展方向。
采用科学计量学的方法,基于Scientometrics期刊,对其收录的1978-2008年的 2 461篇论文进行科学计量分析,研究世界科学计量学的国家、机构和主题布局。通过时间序列趋势图、列表和矩阵图等手段描述科学计量学的国家布局,分析论文数在20篇以上的机构分布情况,利用关键词分析科学计量学研究的主题分布,主要分析工具包括TDA和 Excel。
将群体内部知识转移过程形成的知识转移网络视为成员之间知识引用关系构成的知识网络,借鉴社会网分析思想,从关系维度和结构维度提出面向知识转移网络的知识网分析框架,以揭示群体内部知识转移过程的运行状态,并讨论知识转移研究中社会网分析与知识网分析的联系与区别。
基于本体的军备情报抽取系统主要由两部分构成:知识库和处理程序。该系统基于文本分类技术实现武器类别判定,基于命名实体识别技术实现武器对象判定。依据句法语义约束所形成的信息抽取规则,实现军备情报抽取,并依据本体在一定程度上实现语义层面上的信息整合。
引入数据挖掘和信息抽取技术,提出网络课程资源量化评价指标,构建网络课程资源量化评价系统模型,对资源实时跟踪监测,输出数据作为专家主观评价的补充,初步实验表明该量化评价方案具有较强的客观性和可行性。
针对数字图书馆建设中的数据移植问题,通过对北京航空航天大学图书馆现有异构数据源的分析研究,结合DSpace数据存储方式的特点,设计实现一个基于.NET框架的数据移植解决方案,通过数据抽取、清洗、DC生成和装载等步骤,实现从原有系统到DSpace 的数据移植。系统的应用能有效地利用信息资源、实现数据共享。