Please wait a minute...
Advanced Search
现代图书情报技术  1998, Vol. 14 Issue (4): 19-21     https://doi.org/10.11925/infotech.1003-3513.1998.04.05
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
LSI潜在语义标引方法在情报检索中的应用
冯项云
(中国科学院文献情报中心 北京   100080)
Applying Latent Semantic Indexing to Information Retrieval System
Feng Xiangyun
(The Documentation and Information Centre of the Chinese Academy of Sciences)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

介绍了一种基于词相依性的语义结构, 被称为“潜在语义标引”的文献自动标引和检索技术。采用词频统计和奇值分解技术来捕捉文献的语义结构, 得到标引词、提问和文献的向量表示, 检索系统可以预测文献与提问之间的相关度, 达到检索的目的。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 情报检索自动标引奇值分解向量空间模型    
Abstract

This paper presents a new method of automatic indexing and retrieval.The approach is to take advantage of terms with documents (“latent semantic-structure”)in order to improve the detection of relevent documents on the basis of terms found in queries.A particular technique used is singular-value decomposition in which a large term-document matrix is decomposed into a set  of korthogonal factors.The original matrix can be approximated by linear combination from the factors set.Documents and queries are represented as vectors for med from weighted combinations of these factors. The relevancy prediction is achieved by comput ing the similarity of query and documents.

收稿日期: 1998-03-30      出版日期: 1998-08-25
通讯作者: 冯项云   
作者简介: 冯项云
引用本文:   
冯项云. LSI潜在语义标引方法在情报检索中的应用[J]. 现代图书情报技术, 1998, 14(4): 19-21.
Feng Xiangyun. Applying Latent Semantic Indexing to Information Retrieval System. New Technology of Library and Information Service, 1998, 14(4): 19-21.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.1998.04.05      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y1998/V14/I4/19

1 苏新宁.汉语文献自动标引综析.情报学报,1993,12(4):309-318
2 陈光祚.论单汉字检索系统.情报学报,1992,11(1):11-18
3 张永奎.聚类分析在自然语言处理中的应用.情报学报,1994,12(5):352-358
4 Caid,W.R.,Dumais,S.T.,&Galltant,S,I.(1995).Learned vector-space models for document retrieval.Information Processing&Mangement,31(3),419-429.
5 Cullum,J.K.and Willoughby,R.A.Lanczos algorithms for large symmetric eigenvalue computations-voll Theory,(Chaper 5:Real rectangular matrices).Brikhaser,Boston,1985.
6 Deerwester,S.,Dumais,S.T.,Landauer,T.K.,Furnas,G,W.,&Harshman,R.A.(1990).Indexing by latent semantic analysis.Journal of the Society for Information Science,41(6),391-407.
7 Dumais,S.T.(1993).LSI meets TREC:A status report.InD.Harman(Ed.),The first Text Retrieval Conference
(TREC-1).NIST Special Publication 500-207,137-152.
8 Salton,G.&McGill,M.J.(1983).Introduction to modern informationret rieval.New York:McGraw-Hill.

[1] 熊欣,王昊,张海潮,张宝隆. 中文术语粒度对其区分能力测度的影响分析*[J]. 数据分析与知识发现, 2020, 4(2/3): 143-152.
[2] 白如江, 冷伏海, 廖君华. 一种基于语义组块特征的改进Cosine文本相似度计算方法*[J]. 数据分析与知识发现, 2017, 1(6): 56-64.
[3] 尹相权, 李书宁. 基于VSM的美国一流大学图书馆网站导航文本调查与分析[J]. 数据分析与知识发现, 2017, 1(3): 90-95.
[4] 谭学清, 周通, 罗琳. 一种基于类平均相似度的文本分类算法[J]. 现代图书情报技术, 2014, 30(9): 66-73.
[5] 李湘东, 廖香鹏, 黄莉. LDA模型下书目信息分类系统的研究与实现[J]. 现代图书情报技术, 2014, 30(5): 18-25.
[6] 胡吉明, 肖璐. 向量空间模型文本建模的语义增量化改进研究[J]. 现代图书情报技术, 2014, 30(10): 49-55.
[7] 杨贺, 杨奕虹, 李宁. 关键词-分类号关联词表构建[J]. 现代图书情报技术, 2013, 29(7/8): 107-113.
[8] 沈耕宇, 黄水清, 王东波. 以作者合作共现为源数据的科研团队发掘方法研究[J]. 现代图书情报技术, 2013, 29(1): 57-62.
[9] 赵衍, 陈恒. 一种提高中英文混编文本标引准确性的方法[J]. 现代图书情报技术, 2012, 28(6): 36-42.
[10] 路永和, 何新宇. 锐化高斯模板在文本特征项权重调整方法中的应用[J]. 现代图书情报技术, 2012, (12): 39-44.
[11] 田金凤, 曾新红, 黄华军, 林伟明. 中文叙词表本体概念定义注释的自动构建研究[J]. 现代图书情报技术, 2011, (11): 9-16.
[12] 张志平 李琳娜. NSTL文献检索系统中相关文献推荐功能的设计及实现[J]. 现代图书情报技术, 2010, 26(7/8): 110-113.
[13] 王凯 王朝飞. 一种基于向量空间模型的表格检索算法[J]. 现代图书情报技术, 2010, 26(4): 41-45.
[14] 杨渊, 高柳滨. 基于传递闭包方法的非相关文献知识发现探索——以癌药物靶点为例[J]. 现代图书情报技术, 2010, 26(12): 52-57.
[15] 章顺瑞, 游宏梁. 基于层次聚类算法的中文人名消歧[J]. 现代图书情报技术, 2010, 26(11): 64-68.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn