Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (2): 87-93    DOI: 10.11925/infotech.1003-3513.2011.02.14
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
基于查询意图聚类的实时搜索建议
周之诚
上海应用技术学院图书馆 上海 200235
Real-Time Search Suggestions Based on the Clustering of the User’ s Query Intent
Zhou Zhicheng
Shanghai Institute of Technology Library, Shanghai 200235, China
全文: PDF(547 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

对于搜索引擎返回的结果太多且较少考虑用户个性差异等缺陷,提出根据用户查询意图,实时给予多个主题的搜索建议,帮助用户更准确地描述所需信息,修正查询词与真实意图之间的差距,提高检索效率。同时运用K-means算法,对资源类别的意图特征值相似用户进行聚类,缩小查找目标对象最近邻居的范围,提高搜索建议的实时响应速度。实验结果表明,该方法是可行的。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
周之诚
关键词 聚类搜索建议查询意图搜索引擎    
Abstract

Aimed at the defects that the search engine offers too many results and is lack of considering the differences between the user’s personalities, this paper offers a way to give users real-time search suggestions of multi theme according to the user’s search intent in order to help the users describe the information in need more accurately, as well as narrow the gap between the query word and the user’s real intentions to increase the search efficiency. At the same time, it uses K-means to cluster users who are similar in their intent eigenvalue of resources categories, narrow the range of the nearest neighbor of the searching target, as well as to speed up the real-time response of the search suggestions. The experiment result shows that this method is practical.

Key wordsClustering    Search suggestions    Query intent    Search engine
收稿日期: 2010-11-29     
: 

G354

 
基金资助:

本文系上海应用技术学院社会科学基金项目“数字资源检索中的Lib Suggest模式及其应用研究”(项目编号:SJ2010-04)的研究成果之一。

引用本文:   
周之诚. 基于查询意图聚类的实时搜索建议[J]. 现代图书情报技术, 2011, 27(2): 87-93.
Zhou Zhicheng. Real-Time Search Suggestions Based on the Clustering of the User’ s Query Intent. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2011.02.14.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.02.14


[1] 巴特利 约翰.搜:通向世界的巨型引擎
[M].北京:中信出版社,2006.

[2] 陈冬林,聂规划.基于商品属性隐性评分的协同过滤算法研究
[J]. 计算机应用 ,2006,26(4):966-968.

[3] 吴健,董金祥.关于个性化网站的研究
[J]. 计算机应用研究 ,2000,17(9):21-22.

[4] Mecca G, Raunich S, Pappalardo A. A New Algorithm for Clustering Search Results
[J]. Data & Knowledge Engineering, 2007,62(3):504-522.

[5] Ruthven I. Re-examining the Potential Effectiveness of Interactive Query Expansion . In: Proceedings of the 26th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,Toronto. 2003:213-220.

[6] Speretta M, Gauch S. Personalized Search Based on User Search Histories .In: Proceedings of the 2005 IEEE/WIC/ACM International Conference on Web Intelligence, France. 2005:622-628.

[7] 王辉,高利军,王听忠.个性化服务中基于用户聚类的协同过滤推荐
[J]. 计算机应用 ,2007,27(5):1225-1227.

[8] 孙多.基于兴趣度的聚类协同过滤推荐系统的设计
[J]. 安徽大学学报:自然科学版 ,2007,31(5):19-22.

[9] 张字平,谢小林.基于AJAX技术实现搜索引擎中的搜索提示功能
[J]. 东华理工大学学报:自然科学版, 2008,31(1):81-84.

[10] Kwak M, Cho D S. Collaborative Filtering with Automatic Rating for Recommendation . In: Proceedings of ISIE 2001. New York: Industrial Electronics, 2001(1):625-628.

[11] Mun H, Ok S, Woo Y. An Automatic Rating Technique Based on XML Document
[J]. Computer Science, 2006,2347:424-427.

[12] Lee U, Liu Z, Cho J. Automatic Identification of User Goals in Web Search . In: Proceedings of the 14th International Conference on World Wide Web. New York: ACM Press, 2005:391-400.

[13] Lee H C, Lee S J, Chung Y J. A Study on the Improved Collaborative Filtering Algorithm for Recommender System . In: Proceedings of the 5th ACIS International Conference on Software Engineering Research, Management and Applications. Washington, DC, USA:IEEE Computer Society, 2007:297-304.

[14] 刘慧婷,倪志伟.客户行为的有效聚类
[J]. 计算机工程与应用 ,2010,46(4):12-24.

[15] Adomavicius G, Tuzhilin A. Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions
[J]. IEEE Transactions on Knowledge and Data Engineering, 2005,17(6):734-749.

[16] Zhang M. Enhancing Diversity in Top-N Recommendation . In: Proceedings of the 3rd ACM Conference on Recommender Systems. New York: ACM, 2009.

[17] MovieLens Data Sets . .http://www.grouplens.org/node/73.

[1] 李柯,佐々木勇和. 基于多维小波聚类的空间文本数据情感分布分析[J]. 数据分析与知识发现, 2019, 3(7): 14-22.
[2] 周成,魏红芹. 专利价值评估与分类研究*——基于自组织映射支持向量机[J]. 数据分析与知识发现, 2019, 3(5): 117-124.
[3] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[4] 吴江,赵颖慧,高嘉慧. 医疗舆情事件的微博意见领袖识别与分析研究*[J]. 数据分析与知识发现, 2019, 3(4): 53-62.
[5] 肖连杰,郜梦蕊,苏新宁. 一种基于模糊C-均值聚类的欠采样集成不平衡数据分类算法*[J]. 数据分析与知识发现, 2019, 3(4): 90-96.
[6] 叶佳鑫,熊回香. 基于标签的跨领域资源个性化推荐研究*[J]. 数据分析与知识发现, 2019, 3(2): 21-32.
[7] 张涛,马海群. 一种基于LDA主题模型的政策文本聚类方法研究*[J]. 数据分析与知识发现, 2018, 2(9): 59-65.
[8] 李湘东,高凡,李悠海. 共通语义空间下的跨文献类型文本自动分类研究*[J]. 数据分析与知识发现, 2018, 2(9): 66-73.
[9] 牟冬梅,金姗,琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[10] 王秀芳,盛姝,路燕. 一种基于话题聚类及情感强度的微博舆情分析模型*[J]. 数据分析与知识发现, 2018, 2(6): 37-47.
[11] 杨震,王红军,周宇. 一种截断距离和聚类中心自适应的聚类算法*[J]. 数据分析与知识发现, 2018, 2(3): 39-48.
[12] 范馨月,崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
[13] 熊回香,叶佳鑫,蒋武轩. 改进的DBSCAN聚类算法在社会化标注中的应用*[J]. 数据分析与知识发现, 2018, 2(12): 77-88.
[14] 刘明辉. 基于K-means聚类分析的民航系统恐怖主义风险评估*[J]. 数据分析与知识发现, 2018, 2(10): 21-26.
[15] 王婷婷,韩满,王宇. LDA模型的优化及其主题数量选择研究*——以科技文献为例[J]. 数据分析与知识发现, 2018, 2(1): 29-40.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn