Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (4): 41-45     https://doi.org/10.11925/infotech.1003-3513.2010.04.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
一种基于向量空间模型的表格检索算法
王凯,王朝飞
(中国国防科技信息中心北京 100142)
A Table Retrieval Algorithm Based on the Vector Space Model
Wang Kai,Wang Chaofei
(China Defense Science and Technology Information Center, Beijing 100142,China)
全文: PDF (461 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对目前信息服务机构只能提供文献的检索服务而不提供表格检索功能这一现状,提出一种基于向量空间模型的表格检索算法,并从表格特征抽取、特征词权值设置、检索结果匹配排序等方面进行讨论,为未来表格检索服务提供一定的理论依据。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王凯
王朝飞
关键词 向量空间模型   表格检索  特征域  特征词    
Abstract

 According to the problem that most information institutions can only provide searching service for literature instead of tables, this paper proposes a table retrieval algorithm which is based on Vector Space Model(VSM).Discussions are implemented from the aspects of table character extraction, term value setting, and search result ranking, which provide theoretical basis of the table retrieval services in the future.

Key wordsVSM     Table retrieval     Character region     Character term
收稿日期: 2010-01-20      出版日期: 2010-04-25
: 

TP319

 
通讯作者: 王凯     E-mail: wangkaiabc@163.com
引用本文:   
王凯 王朝飞. 一种基于向量空间模型的表格检索算法[J]. 现代图书情报技术, 2010, 26(4): 41-45.
Wang Kai,Wang Chaofei. A Table Retrieval Algorithm Based on the Vector Space Model. New Technology of Library and Information Service, 2010, 26(4): 41-45.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.04.07      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I4/41

[1] Baeza-Yates R,  Ribeiro-Neto B. Modern Information Retrieval[M]. ACM Press, 1999:9-11.
[2] Liu Y, Bai K, Mitra P,et al. Tablerank:A Ranking Algorithm for Table Search and Retrieval[C]. In:Proceedings of the 22nd National Conference on Artificial intelligence, Vancouver, British Columbia, Canada.2007:317-322.
[3] Liu Y,Mitra P,Giles C L. Automatic Extraction of Table Metadata from Digital Documents[C]. In:Proceedings of ACM/IEEE Joint Conference on Digital Libraries.2006:339–340.
[4] Liu Y, Bai K, Mitra P, et al.Automatic Table Metadata Extraction and Searching in Digital Libraries[C].In:Proceedings of ACM/IEEE Joint Conference on Digital Libraries.2007:91-100.
[5] Salton G, Buckley C. Term-weighting Approaches in Automatic Text Retrieval [J].Information Processing and Management,1988,24(5):513-523.
[6] 樊甫华,张万军. 一种利用向量空间模型快速检索文本情报的方法[J]. 计算机工程与科学,2004, 26(11):59-61.
[7] 王惠,沈玉利.基于内容的图书馆图片检索系统[J].情报科学,2005,23(10):1552-1558.

[1] 周立欣, 林杰. 基于NodeRank算法的产品特征提取研究*[J]. 数据分析与知识发现, 2018, 2(4): 90-98.
[2] 李伟卿, 王伟军. 基于大规模评论数据的产品特征词典构建方法研究*[J]. 数据分析与知识发现, 2018, 2(1): 41-50.
[3] 马静,何雪枫,简旭文. 动态热门话题的“特征词条本体”自动构建与进化研究*[J]. 现代图书情报技术, 2016, 32(10): 33-41.
[4] 王倩倩, 袁勤俭. 卖家描述与买家评论相符度模型研究[J]. 现代图书情报技术, 2014, 30(5): 58-65.
[5] 俞仙子, 高英莲, 马春霞, 刘金星. 提取核心特征词的惩罚性矩阵分解方法——以共词分析为例[J]. 现代图书情报技术, 2014, 30(3): 88-95.
[6] 梁昌勇, 王倩倩, 陆文星, 丁勇. 结合商品标题和描述的在线评论特征词选择方法研究[J]. 现代图书情报技术, 2011, 27(5): 49-54.
[7] 易明,饶洋辉 . 基于点击流数据的用户近期兴趣视图生成方法[J]. 现代图书情报技术, 2006, 1(6): 55-58.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn