Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. 25 Issue (12): 42-46     https://doi.org/10.11925/infotech.1003-3513.2009.12.08
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于本体和文档重构的语义检索方法*
陈兵 邰晓英
(宁波大学信息科学与工程学院   宁波 315211)
Semantic Retrieval Using Ontology and Document Refinement
Chen Bing   Tai Xiaoying
(Faculty of Information Science and Engineering,Ningbo University, Ningbo 315211, China)
全文: PDF (566 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

提出一种新的基于本体和文档重构的语义检索方法,该方法通过构造本体知识库,依据本体知识进行文档重构,将本体的语义描述和语义关联能力应用到现有的信息检索系统。将隐形语义索引(Latent Semantic Indexing,LSI)技术应用到语义检索结果的排序过程中,并与传统的向量空间模型(Vector Space Model,VSM)方法进行对比。实验结果表明本文所提出方法更具有效性,比相对应的VSM方法性能提高约10.55%-17.63%。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈兵
关键词 本体文档重构语义检索隐形语义索引向量空间模型    
Abstract

To enhance the retrieval accuracy of information search engine, this paper proposes an information retrieval system based on Ontology and document refinement, which is realized by employing the semantic description and relevance of Ontology to the system. It describes the using of LSI to replace the traditional VSM  in the results of sorting process. Using a comparative experiment, the authors show the new approach is more feasible and effective than VSM, which can improve the performance upto 10.55%-17.63%.

Key wordsOntology    Document refinement    Semantic retrieval    LSI    VSM
收稿日期: 2009-10-27      出版日期: 2009-12-25
ZTFLH: 

TP391

 
基金资助:

*本文系国家自然科学基金项目“基于内容的医学图像检索理论与算法研究”(项目编号:60472099)的研究成果之一。

通讯作者: 陈兵     E-mail: dabingdejizhi@126.com
作者简介: 陈兵,邰晓英
引用本文:   
陈兵,邰晓英. 基于本体和文档重构的语义检索方法*[J]. 现代图书情报技术, 2009, 25(12): 42-46.
Chen Bing,Tai Xiaoying. Semantic Retrieval Using Ontology and Document Refinement. New Technology of Library and Information Service, 2009, 25(12): 42-46.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.12.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V25/I12/42

[1] Princeton University. WordNet-About WordNet[EB/OL]. [2009-11-17].http://wordnet.princeton.edu/.
[2] 东南大学计算机科学与工程学院. Chinese WordNet[DB/OL]. [2009-11-17]. http://aturstudio.com/wordnet/.
[3] 张敏,宋睿华,马少平.基于语义关系查询扩展的文档重构方法[J].计算机学报,2004, 27(10):1395-1401.
[4] Kontostathis A,Pottenger W M.A Mathematica1 View of Latent Semantic Indexing: Tracing Term Cco-occurrences[R]. 2002.
[5] 罗景, 涂新辉. 基于概率潜在语义分析的中文信息检索[J]. 计算机工程,2008,34(2): 199-201.
[6] 季铎,郑伟,蔡东风. 潜在语义索引中特征优化技术的研究[J]. 中文信息学报, 2009, 23(2): 69-76.
[7]  The Apache Software Foundation. Welcome to Lucene [EB/OL]. [2009-11-17].http://Lucene.apache.org.
[8]  The National Institute of Standards and Technology. JAMA:A Java Matrix Package [EB/OL]. [2009-11-17]. http://math.nist.gov/javanumerics/jama/.
[9] 邰晓英,北研二. 信息检索技术导论[M]. 北京: 科学出版社, 2006: 21-22.
[10] 刘挺,秦兵,张宇,等. 信息检索系统导论[M]. 北京:机械工业出版社,2008:51-52.

[1] 盛姝, 黄奇, 杨洋, 解绮雯, 秦新国. HL7 FHIR框架下中国医疗领域信息交换研究与解决方案[J]. 数据分析与知识发现, 2021, 5(11): 13-28.
[2] 曾桢,李纲,毛进,陈璟浩. 区域公共安全数据治理与业务领域本体研究*[J]. 数据分析与知识发现, 2020, 4(9): 41-55.
[3] 强韶华,罗云鹿,李玉鹏,吴鹏. 基于RBR和CBR的金融事件本体推理研究 *[J]. 数据分析与知识发现, 2019, 3(8): 94-104.
[4] 邓诗琦,洪亮. 面向智能应用的领域本体构建研究*——以反电话诈骗领域为例[J]. 数据分析与知识发现, 2019, 3(7): 73-84.
[5] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[6] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[7] 何有世, 何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[8] 唐慧慧, 王昊, 张紫玄, 王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[9] 庞贝贝, 苟娟琼, 穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[10] 丁晟春, 刘梦露, 傅柱. 概念设计中基于知识流的多维设计知识统一建模技术研究*[J]. 数据分析与知识发现, 2018, 2(2): 11-19.
[11] 涂海丽, 唐晓波. 基于标签的商品推荐模型研究*[J]. 数据分析与知识发现, 2017, 1(9): 28-39.
[12] 陈二静, 姜恩波. 文本相似度计算方法研究综述[J]. 数据分析与知识发现, 2017, 1(6): 1-11.
[13] 白如江, 冷伏海, 廖君华. 一种基于语义组块特征的改进Cosine文本相似度计算方法*[J]. 数据分析与知识发现, 2017, 1(6): 56-64.
[14] 吴丹, 刘畅, 李翼. 用户步行导航过程中的情感变化研究*[J]. 数据分析与知识发现, 2017, 1(5): 42-51.
[15] 尹相权, 李书宁. 基于VSM的美国一流大学图书馆网站导航文本调查与分析[J]. 数据分析与知识发现, 2017, 1(3): 90-95.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn