Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (7/8): 58-65     https://doi.org/10.11925/infotech.1003-3513.2010.07-08.11
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
超大型中文叙词表本体的检索与推理研究
曾新红1,2  黄华军 林伟明1
1(深圳大学图书馆 深圳 518060)
2(深圳大学计算机与软件学院 深圳 518060)
Research on Retrieval and Reasoning of Ultra-Large-Scale OntoThesaurus
Zeng Xinhong1,2  Huang Huajun2  Lin Weiming1
1(Shenzhen University Library, Shenzhen 518060, China)
2(College of Computer and Software, Shenzhen University,Shenzhen 518060, China)
全文: PDF (1140 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

研究超大型中文叙词表本体检索和推理的网络化实现方法,运用其成功实现“中国分类主题词表本体”(CCT1_OntoThesaurus)的共建共享系统(CCT1_OTCSS),且时效性已达到实用要求。提出基于RDF三元组思想的Lucene索引结构构造方法, 以CCT1_OntoThesaurus (基于CCT一版的纯文本电子版建立)为例,构建Lucene索引,在此基础上实现高效的本体检索和一致性检测推理,并进一步实现CCT1_OTCSS的各项功能。该解决方案对于我国现有的几部应用最为广泛的超大型中文叙词表快速实现本体化升级、网络化共建共享和动态完善具有良好的应用前景,对于国内外其他采用XML、RDF或OWL表示的大型知识组织系统(叙词表、本体等)实现网络化检索与推理也具有参考价值。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
曾新红
黄华军
林伟明
关键词 Lucene超大型中文叙词表本体本体检索推理索引    
Abstract

This paper makes a research on the implementation of network-based retrieval and reasoning about Ultra-Large-Scale OntoThesaurus, and the proposed solution has successfully applied to the realization of the CCT1_OTCSS, which is a co-construction and sharing system of an Ultra-Large-Scale Ontology named CCT1_OntoThesaurus. This paper proposes the structure of Lucene index based on the idea of triple “subject, predicate, object” of the RDF, and validates the feasibility of implementing efficient retrieval, terminology services and reasoning based on the Lucene index of Ultra-Large-Scale OntoThesaurus. The solution can be reused for several Ultra-Large-Scale Chinese thesauri most widely used in China at present, implementing quickly Ontology-oriented upgrading, networked co-construction, sharing and dynamic updating for them, and also has a reference value for other large-scale knowledge organization systems (thesauri, Ontology, etc.) in the form of XML, RDF or OWL at home and abroad.

Key wordsLucene    Ultra-Large-Scale OntoThesaurus    Ontology retrieval    Reason    Index
收稿日期: 2010-06-29      出版日期: 2010-09-19
: 

TP18 

 
  G254

 
通讯作者: 曾新红     E-mail: zengxh@szu.edu.cn
作者简介: 曾新红 黄华军 林伟明
引用本文:   
曾新红 黄华军 林伟明. 超大型中文叙词表本体的检索与推理研究[J]. 现代图书情报技术, 2010, 26(7/8): 58-65.
Zeng Xinhong Huang Huajun Lin Weiming. Research on Retrieval and Reasoning of Ultra-Large-Scale OntoThesaurus. New Technology of Library and Information Service, 2010, 26(7/8): 58-65.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.07-08.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I7/8/58

[[1] 曾新红,明仲,蒋颖,等.中文叙词表本体共建共享系统研究[J].情报学报, 2008,27(3):386-394.
[2] Jena – A Semantic Web Framework for Java[EB/OL].[2008-05-22].http://jena.sourceforge.net
[3] W3C.SPARQL Query Language for RDF[EB/OL]. [2008-12-24]. http://www.w3.org/TR/rdf-sparql-query.
[4] 曾新红. 中文叙词表本体——叙词表与本体的融合[J]. 现代图书情报技术,2009(1):34-43.
[5] 曾新红,林伟明,明仲.中文叙词表本体的检索实现及其术语学服务研究[J].现代图书情报技术,2008(2):8-13.
[6] 曾新红,林伟明,明仲.中文叙词表本体一致性检测机制研究与实现[J].现代图书情报技术,2008(5):1-9.
[7] 李新叶,苑津莎.一种快速的XML语义检索算法[J].电子学报,2007,35(11):2220-2225.
[8] 孔令波,唐世渭,杨冬青,等.XML数据的查询技术[J].软件学报,2007,18(6):1400-1418.
[9] 孔令波,唐世渭,杨冬青,等.XML数据索引技术[J].软件学报,2005,16(12):2063-2079.
[10] 邵晓宇.基于本体的大型数据资源智能检索研究[D].合肥:合肥工业大学,2008:10-11.
[11] 汪智勇.本体查询与推理研究及其实现[D].长沙:中南大学,2007:7-39.
[12] 吴元业.基于信任度的个性化推理机的研究与实现[D].深圳:深圳大学,2009:8-14.
[13] 推理机Jess、Racer、Jena 比较[EB/OL]. [2009-04-11].  http://blog.csdn.net/hyzhx/archive/2009/01/20/3844741.aspx
[14] LUCENE.COM.CN 中国[EB/OL]. [2008-10-26]. http://www.lucene.com.cn/about.htm
[15] 陆建江,张亚非,苗壮,等.语义网原理与技术[M].北京:科学出版社,2007:136-139.
[16] CCT1_OTCSSOntoThesaurus-TS.中文叙词本体共建共享系统[EB/OL]. [2010-06-03]. http://nkos.lib.szu.edu.cn:8080/ThesaurusProjectForCCTWL/login.jsp.
[17] CCT1_OTCSSOntoThesaurus-API[EB/OL]. [2010-06-03]. http:// nkos.lib.szu.edu.cn:8080/ThesaurusProjectForCCTWL/services/ThesaurusService?wsdl.
[18] 宋炜,张铭.语义网简明教程[M].北京:高等教育出版社,2004:23-139.
[19] 林伟明,曾新红. OntoThesaurus Web Service API及其应用研究[J]. 图书情报工作,2010,54(2):119-139.

[1] 阮小芸,廖健斌,李祥,杨阳,李岱峰. 基于人才知识图谱推理的强化学习可解释推荐研究*[J]. 数据分析与知识发现, 2021, 5(6): 36-50.
[2] 李轲禹,王昊,龚丽娟,唐慧慧. 学术数据库中研究主题术语的质量测度及分布研究*[J]. 数据分析与知识发现, 2020, 4(6): 91-108.
[3] 朱超宇, 刘雷. 基于知识图谱的医学决策支持应用综述*[J]. 数据分析与知识发现, 2020, 4(12): 26-32.
[4] 强韶华,罗云鹿,李玉鹏,吴鹏. 基于RBR和CBR的金融事件本体推理研究 *[J]. 数据分析与知识发现, 2019, 3(8): 94-104.
[5] 贾君枝,叶壮壮. 基于潜在语义索引的Wikidata机构实体聚类研究 *[J]. 数据分析与知识发现, 2019, 3(10): 56-65.
[6] 夏立新, 杨金庆, 程秀峰. 基于情境感知技术的移动数据自动采集系统设计与实现*[J]. 数据分析与知识发现, 2017, 1(5): 82-93.
[7] 谢靖, 王敬东, 吴振新, 张智雄, 王颖, 叶志飞. 科技文献检索系统语义丰富化框架的设计与实践*[J]. 数据分析与知识发现, 2017, 1(4): 84-93.
[8] 刘健,毕强,刘庆旭,王福. 数字文献资源内容服务推荐研究*——基于本体规则推理和语义相似度计算[J]. 现代图书情报技术, 2016, 32(9): 70-77.
[9] 丁恒,陆伟. 标准文献知识服务系统设计与实现*[J]. 现代图书情报技术, 2016, 32(7-8): 120-128.
[10] 胡吉颖,吴振新,谢靖,张智雄. 构建面向WARC文档的全文索引系统[J]. 现代图书情报技术, 2016, 32(5): 91-98.
[11] 马天翼,张朋柱,冯浩垠. 网络外包任务的知识需求建模研究*[J]. 现代图书情报技术, 2016, 32(3): 74-81.
[12] 刘彤,倪维健,柳梅. 面向搜索引擎查询日志的领域术语自动识别方法*[J]. 现代图书情报技术, 2016, 32(2): 25-33.
[13] 鲍玉来,毕强. 蒙古文音乐领域的语义检索初探*[J]. 现代图书情报技术, 2016, 32(11): 94-100.
[14] 童国平, 孙建军. 基于搜索日志的用户行为分析[J]. 现代图书情报技术, 2015, 31(7-8): 80-88.
[15] 梁艺多, 翟军. 本体推理在关联数据链接发现中的应用研究[J]. 现代图书情报技术, 2015, 31(4): 87-95.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn