Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (1): 52-56     https://doi.org/10.11925/infotech.1003-3513.2011.01.08
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
特征词抽取和相关性融合的伪相关反馈查询扩展
冯平1, 黄名选2
1. 广西工学院电子信息与控制工程系 柳州 545006;
2. 广西教育学院数学与计算机科学系 南宁 530023
Query Expansion of Pseudo Relevance Feedback Based on Feature Terms Extraction and Correlation Fusion
Feng Ping1, Huang Mingxuan2
1. Electronic Information and Control Engineering Department, Guangxi University of Technology, Liuzhou 545006, China;
2. Department of Math and Computer Science, Guangxi College of Education, Nanning 530023, China
全文: PDF (411 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对现有信息检索系统中存在的词不匹配问题,提出一种基于特征词抽取和相关性融合的伪相关反馈查询扩展算法以及新的扩展词权重计算方法。该算法从前列n篇初检局部文档中抽取与原查询相关的特征词,根据特征词在初检文档集中出现的频度以及与原查询的相关度,将特征词确定为最终的扩展词实现查询扩展。实验结果表明,该方法有效,并能提高和改善信息检索性能。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
冯平
黄名选
关键词 相关性伪相关反馈查询扩展信息检索    
Abstract

Aiming at the term mismatch issues of existing information retrieval systems, a novel query expansion algorithm of pseudo relevance feedback is proposed based on feature terms extraction and correlation fusion. At the same time, a new computing method for weights of expansion terms is also given. The algorithm can extract feature terms related to original query from the n chapter top-ranked retrieved local documents, and then identify those feature terms as final expansion terms according to the frequency of each feature term appeared in the local documents and the correlation between each feature term and the entire original query for query expansion. The results of the experiment show that the method is effective,and it can enhance and improve the performance of information retrieval.

Key wordsCorrelation    Pseudo relevance feedback    Query expansion    Information retrieval
收稿日期: 2010-11-25      出版日期: 2011-02-12
: 

TP391

 
基金资助:

本文系广西教育厅科研项目 “基于加权负关联规则挖掘的文本信息检索技术研究”(项目编号:201010LX679)和广西教育学院2010年度院级重点课题“基于正负关联规则的信息检索技术研究”(项目编号:桂教院科研[2010]7号(重点)-3)的研究成果之一。

引用本文:   
冯平, 黄名选. 特征词抽取和相关性融合的伪相关反馈查询扩展[J]. 现代图书情报技术, 2011, 27(1): 52-56.
Feng Ping, Huang Mingxuan. Query Expansion of Pseudo Relevance Feedback Based on Feature Terms Extraction and Correlation Fusion. New Technology of Library and Information Service, 2011, 27(1): 52-56.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.01.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I1/52


[1] 黄名选,严小卫,张师超. 查询扩展技术进展与展望
[J]. 计算机应用与软件 ,2007, 24(11): 1-4,8.

[2] Yu S, Cai D, Wen J, et al. Improving Pseudo-Relevance Feedback in Web Information Retrieval Using Web Page Segmentation. In: Proceedings of the 12th World Wide Web Conference (WWW2003), Budapest, Hungary. 2003:11-18.

[3] Huang X, Huang Y R, Wen M, et al. Applying Data Mining to Pseudo-Relevance Feedback for High Performance Text Retrieval. In: Proceedings of the 6th IEEE International Conference on Data Mining (ICDM’06), Hong Kong. 2006: 295-306.

[4] 黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展
[J]. 软件学报 , 2009,20(7):1854-1865.

[5] Cao G H, Nie J Y, Gao J F, et al. Selecting Good Expansion Terms for Pseudo-Relevance Feedback. In: Proceedings of SIGIR’08 Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (2008), Singapore.2008:243-250.

[6] Salton G, Buckley C. Improving Retrieval Performance by Relevance Feedback
[J]. Journal of the American Society for Information Science, 1990, 41(4):288-297.

[7] Xu J, Croft W B. Query Expansion Using Local and Global Document Analysis. In: Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Zurich, Switzerland. 1996: 4-11.

[8] Hang C, Wen J R, Nie J Y, et al. Query Expansion by Mining User Logs
[J]. IEEE Transactions on Knowledge and Data Engineering, 2003, 15(4): 829-839.

[9] Fonseca B M, Golgher P B, Moura E S, et al. Discovering Search Engine Related Query Using Association Rules
[J]. Journal of Web Engineering, 2004, 2(4): 215-227.

[10] Zhang C, Qin Z, Yan X. Association-based Segmentation for Chinese-Crossed Query Expansion
[J]. IEEE Intelligent Informatics Bulletin, 2005, 5(1): 18-25.

[11] Manmatha R, Rath T. Using Models of Score Distributions in Information Retrieval. In: Proceedings of the 24th ACM Conference on Research and Development in Information Retrieval, New York, USA. 2001.

[12] Han J, Kamber M. Data Mining: Concepts and Techniques
[M]. 1st Edition. Morgan: Kaufmann Publishers,2000.

[1] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[2] 孟镇,王昊,虞为,邓三鸿,张宝隆. 基于特征融合的声乐分类研究*[J]. 数据分析与知识发现, 2021, 5(5): 59-70.
[3] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[4] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[5] 刘菲,成晓强,吴华意. 基于夜间灯光亮度的OpenStreetMap数据完整性检验 *[J]. 数据分析与知识发现, 2019, 3(9): 36-44.
[6] 桂思思,张晓娟,王鑫. 查询歧义性程度自动标注指标的替代性 验证研究*[J]. 数据分析与知识发现, 2019, 3(2): 79-89.
[7] 王欣瑞,何跃. 社交媒体用户交互行为与股票市场的关联分析研究: 基于新浪财经博客的实证[J]. 数据分析与知识发现, 2019, 3(11): 108-119.
[8] 孙海霞, 王蕾, 吴英杰, 华薇娜, 李军莲. 科技文献数据库中机构名称匹配策略研究*[J]. 数据分析与知识发现, 2018, 2(8): 88-97.
[9] 吴朋民, 陈挺, 王小梅. Altmetrics与引文指标相关性研究[J]. 数据分析与知识发现, 2018, 2(6): 58-69.
[10] 杨超凡, 邓仲华, 彭鑫, 刘斌. 近5年信息检索的研究热点与发展趋势综述*——基于相关会议论文的分析[J]. 数据分析与知识发现, 2017, 1(7): 35-43.
[11] 张肃. 中国城镇居民信息消费的空间相关性与影响因素分析*——基于动态空间杜宾面板模型的实证研究[J]. 数据分析与知识发现, 2017, 1(5): 52-61.
[12] 张晓娟, 韩毅. 时态信息检索研究综述*[J]. 数据分析与知识发现, 2017, 1(1): 3-15.
[13] 黄名选. 基于矩阵加权关联模式的印尼中跨语言信息检索模型*[J]. 数据分析与知识发现, 2017, 1(1): 26-36.
[14] 丁恒, 陆伟. 基于相关性的跨模态信息检索研究*[J]. 现代图书情报技术, 2016, 32(1): 17-23.
[15] 刘峰, 李煜, 吕学强, 李卓. 查询主题分类方法研究[J]. 现代图书情报技术, 2015, 31(4): 10-17.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn