Please wait a minute...
Advanced Search
现代图书情报技术  2006, Vol. 1 Issue (12): 40-43     https://doi.org/10.11925/infotech.1003-3513.2006.12.11
  信息检索技术 本期目录 | 过刊浏览 | 高级检索 |
基于网页摘要分析的元搜索引擎研究*
翁勍力1,2 施水才2 赵捧未1
1(西安电子科技大学经济管理学院   西安 710071)
2(北京信息科技大学中文信息处理研究中心 北京 100101)
A Study on Meta-search Based on Abstract Analysis
Weng Qingli1,2   Shi Shuicai2    Zhao Pengwei1
1(Institute of Economy and Management,  Xidian University, Xi’an 710071,China)
2(Chinese Information Processing Research Center, Beijing Information Science &Technology University, Beijing 100101,China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

针对目前搜索引擎返回结果的海量性,构建一个元搜索引擎,旨在高效利用多个成员搜索引擎返回的结果。介绍元搜索引擎的基本架构及当前结果融合的主要方法,应用统计学方法研究网页标题、网页摘要与网页文本之间的相关性关系,从而确定相关度权值进行结果相关性判断。实验证明,元搜索引擎搜索结果的平均准确率比各个成员引擎的搜索结果平均准确率都有较大提高。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
翁勍力
施水才
赵捧未
关键词 元搜索摘要分析相关度    
Abstract

Facing too much results returned by different search engines, this paper designs a meta-search in order to fully utilize the results. It introduces the basic structure of meta-search and methods of results merging. And employs the techniques of statistics to study the relevance between title and page content, relevance between abstract and page content, and then fixes the weights of title and abstract when judge the relevance of search results. The experiment proves the improvement of average veracity comparing with the member search engines.

Key wordsMeta-search    Abstract analysis    Relevance
收稿日期: 2006-09-14      出版日期: 2006-12-25
: 

TP391

 
基金资助:

*本文系国家自然科学基金项目“Web数据挖掘技术研究”(项目编号:60272084)及北京市教育委员会科技发展计划重点项目“面向大规模真实文本的数据挖掘技术”(项目编号:KZ200310772013)的研究成果之一。

通讯作者: 翁勍力     E-mail: tutu_19821120@hotmail.com
作者简介: 翁勍力,施水才,赵捧未
引用本文:   
翁勍力,施水才,赵捧未 . 基于网页摘要分析的元搜索引擎研究*[J]. 现代图书情报技术, 2006, 1(12): 40-43.
Weng Qingli,Shi Shuicai,Zhao Pengwei . A Study on Meta-search Based on Abstract Analysis. New Technology of Library and Information Service, 2006, 1(12): 40-43.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.12.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I12/40

1李广建,黄崑. 元搜索引擎及其主要技术. 情报科学, 2002, 20(2) :175-179
2Eric J.Glover, Steve Lawrence, William P.Birmingham, C.Lee Giles. Architecture of a Metasearch Engine that Supports User Information Needs. In Proceedings of the English International Conference on Information Knowledge Management,(CIKM-99), English, 1999
3陈晶. 元搜索引擎实现技术.情报杂志,2005(5):79-81
4Robert M. Losee, Gary Marchionini, Gregory B.Newby, Paul Solomon, Ellen Voorhees. Profusion: Intelligent Fusion from Multiple Distributed Search Engines. Distributed search engines. volume 2, pages, 1996.637-649
5张卫丰,徐宝文,周晓宇,管宇,许蕾. 元搜索引擎结果生成技术研究.小型微型计算机系统, 2003, 24(1):34-36
6Eric J.Glover, Steve Lawrence, William P.Birmingham, C.Lee Giles. Architecture of a Metasearch Engine that Supports User Information Needs. In Proceedings of the Eigth International Conference on Information Knowledge Management.pp.210-216,Copyright 1999,ACM
7刘畅,林剑峰,王雁杰.元搜索引擎的调查分析.现代图书情报技术,2004,114(9):40-43
8赖茂生.计算机情报检索.北京: 北京大学出版社,1993
9陈伟雄.基于元搜索的中文搜索引擎研究与实现:[学位论文].北京:清华大学, 2004
10赵玮,温小霓.应用统计学教程.西安:西安电子科技大学出版社,2003

[1] 朱玲,薛春香,章成志,傅柱. 微博用户标签与博文内容相关度研究*[J]. 现代图书情报技术, 2016, 32(3): 18-24.
[2] 任海英, 于立婷. 一种基于维基百科的多策略词义消歧方法[J]. 现代图书情报技术, 2015, 31(11): 18-25.
[3] 杨志墨, 刘怀亮, 赵辉. 一种基于复杂网络的中文文本表示算法[J]. 现代图书情报技术, 2014, 30(11): 38-44.
[4] 沈耕宇, 黄水清, 王东波. 以作者合作共现为源数据的科研团队发掘方法研究[J]. 现代图书情报技术, 2013, 29(1): 57-62.
[5] 刘萍, 陈烨. 词汇相似度研究进展综述[J]. 现代图书情报技术, 2012, 28(7): 82-89.
[6] 景璟, 洪颖, 蒋媛媛, 杲晓锋. 基于相关反馈的Web检索提问融合研究[J]. 现代图书情报技术, 2011, 27(1): 57-62.
[7] 徐洋 王文生 谢能付. 基于用户行为学习的元搜索结果聚类方法研究*[J]. 现代图书情报技术, 2010, 26(4): 53-58.
[8] 聂靖, 李强, 庞力, 应慧杰. 移动元搜索引擎中网页内容提取算法研究[J]. 现代图书情报技术, 2010, 26(10): 54-58.
[9] 段寿建,杨朝凤,甘健侯. 基于领域本体的概念语义相似度和相关度综合量化研究*[J]. 现代图书情报技术, 2009, 25(11): 40-43.
[10] 王梅文. 基于本体进行自动分类的元搜索引擎的设计与实现[J]. 现代图书情报技术, 2008, 24(9): 58-63.
[11] 谢蕙,秦杰,胡双双. 基于用户查询关键词的网页去重方法研究[J]. 现代图书情报技术, 2008, 24(7): 43-46.
[12] 姜华. 基于本体的语义检索技术研究与实现[J]. 现代图书情报技术, 2008, 24(4): 39-43.
[13] 李培. 基于词序的多关键词加权检索融合研究*[J]. 现代图书情报技术, 2008, 24(10): 32-37.
[14] 邱宇红,郭继军. 向量空间模型在医学文献相关性研究中的应用[J]. 现代图书情报技术, 2007, 2(7): 63-67.
[15] 许文,都云程,李渝勤,施水才 . 一种通用HTML网页主题信息提取方法*[J]. 现代图书情报技术, 2007, 2(1): 40-43.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn