Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (6): 61-66     https://doi.org/10.11925/infotech.1003-3513.2008.06.12
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于向量空间模型的文献相关性数据库的研究与实现*
余希田 万莉莉 胡铁军 李丹亚
(中国医学科学院医学信息研究所 北京 100020)
Research and Implementation of Related Articles Database Based on Vector Space Model
Yu Xitian  Wan Lili  Hu Tiejun  Li Danya
(Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020, China)
全文: PDF (541 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

探讨“相关性”的概念,简述文献相关性数据库的研究现状,提出基于词表和特征项提取的向量空间模型,并在此基础上设计、构建中国生物医学工程文献相关性数据库及其检索系统。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李丹亚
胡铁军
余希田
万莉莉
关键词 文献相关性数据库特征项向量空间模型生物医学工程文献    
Abstract

In this paper, a Vector Space Model (VSM) based on terms extraction with lexicon is introduced, and the related articles database and retrieval system of Chinese biomedical engineering literatures is designed and implemented. In addition, a comparison study on VSM based on suffix tree for the database is conducted.

Key wordsRelated articles database    Term    Vector space model    Biomedical engineering literatures
收稿日期: 2008-02-26      出版日期: 2008-06-25
: 

G354 

 
  TP391

 
基金资助:

*本文系美国中华医学基金会(CMB)基金项目“建立协和医科大学知识发现中心”(项目编号:#03-787)的研究成果之一。

通讯作者: 余希田     E-mail: yuxitian1234@163.com
作者简介: 余希田,万莉莉,胡铁军,李丹亚
引用本文:   
余希田,万莉莉,胡铁军,李丹亚. 基于向量空间模型的文献相关性数据库的研究与实现*[J]. 现代图书情报技术, 2008, 24(6): 61-66.
Yu Xitian,Wan Lili,Hu Tiejun,Li Danya. Research and Implementation of Related Articles Database Based on Vector Space Model. New Technology of Library and Information Service, 2008, 24(6): 61-66.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.06.12      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I6/61

[1] 王家钺.信息检索中“相关性概念”的研究[J].现代外语,2001,24(2):181-191.
[2] 孙建军,成颖.基于信息检索交互模型的相关性研究[J].中国图书馆学报,2005,31(1):41-45,70.
[3] Cooper W S. A Definition of Relevance for Information Retrieval[J]. Information Storage and Retrieval, 1971,7(1):19-37.
[4] Mizzaro S. Relevance:The Whole History[J]. Journal of the American Society of Information Science, 1997,48(9):810-832.
[5] 赖茂生,赵丹群,韩圣龙,等.计算机情报检索[M].北京:北京大学出版社,1993.
[6] 赖茂生.科技文献检索[M].第2版.北京:北京大学出版社,1994.
[7] 李军莲.PubMed检索系统的文献相关性判定研究及应用设想[D].北京:中国协和医科大学,2001.
[8] 徐莉,胡铁军.建立中国生物医学文献相关性数据库的探讨[D].北京:中国协和医科大学,2002.
[9] 王闰强,胡铁军.中国生物医学文献相关性数据库建设及应用研究[D].北京:中国协和医科大学,2003.
[10] 包金龙.基于向量空间模型的信息检索系统的设计[J].情报杂志,2005,24(7):44-45,49.
[11] 邱宇红,郭继军.向量空间模型在医学文献相关性研究中的应用[J].现代图书情报技术,2007(7):63-67.
[12] 万莉莉,胡铁军.中国生物医学工程文献相关性数据库建设研究[D].北京:中国协和医科大学,2007.
[13] 刘斌,陈桦.向量空间模型信息检索技术讨论[J].情报杂志,2006,25(7):91-93.
[14] 任慧玲,胡铁军,李丹亚,等.中文期刊文献数字对象唯一标识符的研究[J].情报学报,2004,23(4):437-443.
[15] 刘春艳,胡铁军.PubMed生物医学工程文献数据挖掘[D].北京:中国协和医科大学,2005.
[16] Wilbur W J, Yang Y. An Analysis of Statistical Term Strength and Its Use in the Indexing and Retrieval of Molecular Biology Texts[J]. Computers in Biology and Medicine, 1996,26(3): 209-222.
[17] Buckley C,  Lewit A F. Optimization of Inverted Vector Searches[C].In: Proceedings of The 8th Annual International ACMSIGIR Conference on Research and Development in Information Retrieval, Montreal, 1985:97-110.
[18] Lucarella D. A Document Retrieval System Based on Nearest Neighbor Searching[J]. Journal of Information Science, 1988,14(1):25-33.
[19] Salton G, Fox E, Wu H. Extended Boolean Information Retrieval[J]. Communication of the ACM, 1983,26:1022-1036.
[20] 郭莉,张吉,谭建龙.基于后缀树模型的文本实时分类系统的研究和实现[J].中文信息学报,2005,19(5):16-23.

[1] 白如江, 冷伏海, 廖君华. 一种基于语义组块特征的改进Cosine文本相似度计算方法*[J]. 数据分析与知识发现, 2017, 1(6): 56-64.
[2] 尹相权, 李书宁. 基于VSM的美国一流大学图书馆网站导航文本调查与分析[J]. 数据分析与知识发现, 2017, 1(3): 90-95.
[3] 谭学清, 周通, 罗琳. 一种基于类平均相似度的文本分类算法[J]. 现代图书情报技术, 2014, 30(9): 66-73.
[4] 李湘东, 廖香鹏, 黄莉. LDA模型下书目信息分类系统的研究与实现[J]. 现代图书情报技术, 2014, 30(5): 18-25.
[5] 胡吉明, 肖璐. 向量空间模型文本建模的语义增量化改进研究[J]. 现代图书情报技术, 2014, 30(10): 49-55.
[6] 沈耕宇, 黄水清, 王东波. 以作者合作共现为源数据的科研团队发掘方法研究[J]. 现代图书情报技术, 2013, 29(1): 57-62.
[7] 路永和, 何新宇. 锐化高斯模板在文本特征项权重调整方法中的应用[J]. 现代图书情报技术, 2012, (12): 39-44.
[8] 田金凤, 曾新红, 黄华军, 林伟明. 中文叙词表本体概念定义注释的自动构建研究[J]. 现代图书情报技术, 2011, (11): 9-16.
[9] 王军辉, 胡铁军, 李丹亚. 相关文献检索研究综述[J]. 现代图书情报技术, 2011, 27(1): 39-45.
[10] 张志平 李琳娜. NSTL文献检索系统中相关文献推荐功能的设计及实现[J]. 现代图书情报技术, 2010, 26(7/8): 110-113.
[11] 王凯 王朝飞. 一种基于向量空间模型的表格检索算法[J]. 现代图书情报技术, 2010, 26(4): 41-45.
[12] 杨渊, 高柳滨. 基于传递闭包方法的非相关文献知识发现探索——以癌药物靶点为例[J]. 现代图书情报技术, 2010, 26(12): 52-57.
[13] 章顺瑞, 游宏梁. 基于层次聚类算法的中文人名消歧[J]. 现代图书情报技术, 2010, 26(11): 64-68.
[14] 孙素芬,罗长寿,魏清凤. Web农业实用技术自动问答系统设计实现*[J]. 现代图书情报技术, 2009, 25(7-8): 70-74.
[15] 陈兵,邰晓英. 基于本体和文档重构的语义检索方法*[J]. 现代图书情报技术, 2009, 25(12): 42-46.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn