基于内部文档比较的重排序算法*

doi:10.11925/infotech.1003-3513.2009.11.10

现代图书情报技术

2009, Vol. 25

Issue (11): 49-52 https://doi.org/10.11925/infotech.1003-3513.2009.11.10

知识组织与知识管理

本期目录 | 过刊浏览 | 高级检索

基于内部文档比较的重排序算法*

原福永郭丽娜毛伟伟

(燕山大学信息科学与工程学院秦皇岛 066004)

Re-ranking Algorithm Based on the Inter-Documents Comparison

Yuan Fuyong Guo Lina Mao Weiwei

(College of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, China)

摘要
参考文献
相关文章
Metrics

全文: PDF (319 KB)
输出: BibTeX | EndNote (RIS)

摘要

分析现有搜索引擎重排序方法的不足，并对初始检索结果集中的每个文档相对于其他文档与查询词之间的相似度进行研究。提出一个基于内部文档比较的重排序算法，将检索结果中的文档按照相似度以从大到小的顺序呈现给用户。实验结果表明，该算法比当前的重排序算法具有更高的查准率。

	服务

	把本文推荐给朋友
	加入引用管理器
	E-mail Alert
	RSS
	作者相关文章
	原福永
	郭丽娜

关键词 ：搜索引擎, 内部文档, 比较, 相似度

Abstract：

This paper analyzes the shortages of the existing re-ranking methods of the search engine and researches on the similarity between each document and the query, which refers to the other documents of the result set. It presents a re-ranking algorithm based on the inter-documents comparison and shows the documents to the users, according to the descending order of the similarity. The results of the experiments demonstrate that the algorithm has a much better precision than the current re-ranking algorithms.

Key words： Search engine Inter-document Comparison Similarity

收稿日期: 2009-10-12 出版日期: 2009-11-25

TP393

基金资助:

*本文系国家社会科学基金“十一五”规划子课题“信息技术环境下多元学与教方式有效融入日常教学的研究”（项目编号：BCA060616）的研究成果之一。

通讯作者: 郭丽娜 E-mail: guolina66@163.com

作者简介: 原福永,郭丽娜,毛伟伟

引用本文:

原福永,郭丽娜,毛伟伟. 基于内部文档比较的重排序算法*[J]. 现代图书情报技术, 2009, 25(11): 49-52.
Yuan Fuyong,Guo Lina,Mao Weiwei. Re-ranking Algorithm Based on the Inter-Documents Comparison. New Technology of Library and Information Service, 2009, 25(11): 49-52.

链接本文:

https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.11.10 或 https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V25/I11/49

［1］ Wray Buntine, Jaakko Löfström, Sami Perttu, et al.Topic-specific Scoring of Documents for Relevant Retrieval［C］. In: Proceedings of ICML 2005 Workshop 4:Learning in Web Search, Bonn， Germany.2005.
［2］张俊林. Google怎么做（3.搜索结果重排序)［EB/OL］.［2009-09-10］. http://blog.csdn.net/malefactor/archive/2006/05/19/745966.aspx.
［3］杨广翔,俞宁,谌莉.搜索引擎结果的重排序方法［J］.计算机应用,2005,25(2):306-307.
［4］徐宝文，张卫丰.搜素引擎与信息获取技术［M］.北京：清华大学出版社，2003:113-115.
［5］徐金雷，杨晓江.专业搜索引擎的排序算法研究［J］.现代图书情报技术,2006(7):20-21

[1]	韩辉, 刘秀文. 海事适任评估中主观题自动评分技术研究^*[J]. 数据分析与知识发现, 2021, 5(8): 113-121.
[2]	刘文斌, 何彦青, 吴振峰, 董诚. 基于BERT和多相似度融合的句子对齐方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 48-58.
[3]	闫强,张笑妍,周思敏. 基于义原相似度的关键词抽取方法 ^*[J]. 数据分析与知识发现, 2021, 5(4): 80-89.
[4]	向卓元,刘志聪,吴玉. 基于用户行为自适应推荐模型研究 ^*[J]. 数据分析与知识发现, 2021, 5(4): 103-114.
[5]	吕学强,罗艺雄,李家全,游新冬. 中文专利侵权检测研究综述^*[J]. 数据分析与知识发现, 2021, 5(3): 60-68.
[6]	吴彦文, 蔡秋亭, 刘智, 邓云泽. 融合多源数据和场景相似度计算的数字资源推荐研究^*[J]. 数据分析与知识发现, 2021, 5(11): 114-123.
[7]	盛嘉祺, 许鑫. 融合主题相似度与合著网络的学者标签扩展方法研究*[J]. 数据分析与知识发现, 2020, 4(8): 75-85.
[8]	徐以聪,田学东,李新福,杨芳,史青宣. 基于犹豫模糊权重的数学表达式检索 ^*[J]. 数据分析与知识发现, 2020, 4(7): 118-126.
[9]	苏庆,陈思兆,吴伟民,李小妹,黄佃宽. 基于学习情况协同过滤算法的个性化学习推荐模型研究^*[J]. 数据分析与知识发现, 2020, 4(5): 105-117.
[10]	刘萍,彭小芳. 基于形式概念分析的词汇相似度计算^*[J]. 数据分析与知识发现, 2020, 4(5): 66-74.
[11]	高原,施元磊,张蕾,曹天奕,冯筠. 基于游记文本的游客游览行程重构^*[J]. 数据分析与知识发现, 2020, 4(2/3): 165-172.
[12]	李家全,李宝安,游新冬,吕学强. 基于专利知识图谱的专利术语相似度计算研究^*[J]. 数据分析与知识发现, 2020, 4(10): 104-112.
[13]	俞琰,陈磊,姜金德,赵乃瑄. 结合词向量和统计特征的专利相似度测量方法 ^*[J]. 数据分析与知识发现, 2019, 3(9): 53-59.
[14]	关鹏,王曰芬,傅柱. *基于LDA的主题语义演化分析方法研究 ^ ——以锂离子电池领域为例**[J]. 数据分析与知识发现, 2019, 3(7): 61-72.
[15]	张佩瑶,刘东苏. 基于词向量和BTM的短文本话题演化分析^*[J]. 数据分析与知识发现, 2019, 3(3): 95-101.

Viewed

Full text

Abstract

Cited

Shared

Discussed