Please wait a minute...
Advanced Search
现代图书情报技术  2014, Vol. 30 Issue (1): 36-42     https://doi.org/10.11925/infotech.1003-3513.2014.01.06
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
用户查询意图的层次化识别方法*
唐静笑1, 吕学强1, 柳成洋2, 李涵2
1北京信息科技大学网络文化与数字传播北京市重点实验室 北京 100101; 2中国标准化研究院 北京 100191
A Hierarchical Framework for User Intention Recognition
Tang Jingxiao1, Lv Xueqiang1, Liu Chengyang2, Li Han2
1Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,Beijing Information Science and Technology University,Beijing 100101,China; 2China National Institute of Standardization,Beijing 100191,China
全文: PDF (450 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 【目的】向搜索引擎提交的查询均有其潜在的查询意图,准确识别查询意图可以提高查询的效率。【方法】针对有明显意图的查询,采用滑动窗口寻找最大公共子串的策略抽取用户的意图模板,然后用模板匹配的方法识别用户查询意图。对无明显意图的查询,采用多特征融合的分类方法进行识别。【结果】实验结果表明,采用层次化识别方法和单独使用分类器方法相比,识别查询意图的实验结果正确率得到19.04% 的提升。【局限】可获得的意图模板是有限的,因此显式意图查询的识别存在局限性。大规模数据情况下,模式匹配及机器学习算法的运算量很大,需要进一步优化算法。【结论】实验证明该方法在Web意图识别中是有效的,对意图识别率的提高有积极意义。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
唐静笑
吕学强
柳成洋
李涵
关键词 信息检索查询意图层次化识别意图模板    
Abstract:[Objective] Any query search engine has its potential query intention,and accurate intention identification can improve the efficiency. [Methods] For the explicit intent queries,the authors employ sliding window strategy to find the maximum common substring for extracting user intent templates and then use the templates to identify the user intention. For implicit intent queries,the authors use a multi-feature integration method to build classifier for the final query intention recognition. [Results] Experimental results show that the hierarchical intention recognition framework can achieve better precision comparing with methods based on classifier,and the accuracy enhances 19.04%. [Limitations] Intention template obtaining is limited,so explicit intention recognition has limitation. For large-scale data,complexity of the pattern match and machine learning algorithm is very high,the algorithm need further optimization. [Conclusions] Experiment shows that this method is valid in Web intention recognition,which has a positive significance for improvement of intention recognition rate.
Key wordsInformation retrieval    Query intent    Hierarchical identification    Intent template
收稿日期: 2014-02-14      出版日期: 2014-02-14
:  TP391  
基金资助:本文系国家自然科学基金项目“基于本体的专利自动标引研究”(项目编号:61271304)和北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(项目编号:KZ201311232037)的研究成果之一。
通讯作者: 通讯作者 唐静笑 E-mail:tang.jingxiao@163.com   
作者简介: 作者贡献声明:唐静笑:进行实验以及论文起草;吕学强:提出研究思路,设计研究方案;柳成洋:采集、清洗和分析数据;李涵:论文最终版本的修订。
引用本文:   
唐静笑,吕学强,柳成洋,李涵. 用户查询意图的层次化识别方法*[J]. 现代图书情报技术, 2014, 30(1): 36-42.
Tang Jingxiao,Lv Xueqiang,Liu Chengyang,Li Han. A Hierarchical Framework for User Intention Recognition. New Technology of Library and Information Service, 2014, 30(1): 36-42.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2014.01.06      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2014/V30/I1/36
[1] Broder A. A Taxonomy of Web Search[J]. ACM SIGIR Forum,2002,36(2):3-10.
[2]Jansen B J,Booth D L,Spink A. Determining the User Intent of Web Search Engine Queries[C]. In:Proceedings of the 16th International Conference on World Wide Web. New York,NY,USA:ACM,2007:1149-1150.
[3]Guo Q,Agichtein E. Exploring Mouse Movements for Inferring Query Intent[C]. In:Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 2008:707-708.
[4]Herrera M R,Cristo M,Moura E S,et al. Exploring Features for the Automatic Identification of User Goals in Web Search[J]. Information Processing & Management,2010,46(2):131-142.
[5]Hu J,Wang G,Lochovsky F,et al. Understanding User’s Query Intent with Wikipedia[C]. In:Proceedings of the 18th International Conference on World Wide Web. New York,NY,USA:ACM,2009:471-480.
[6]张晓娟,陆伟. 利用查询重构识别查询意图[J]. 现代图书情报技术,2013(1):8-14. (Zhang Xiaojuan,Lu Wei. Identifying Query Intent by Exploiting Query Refinement[J]. New Technology of Library and Information Service,2013(1):8-14.)
[7]吴晓辉,宋萍萍,张荣欣. 有无查询意图的分类与实现架构模型研究[J]. 情报科学,2009,27(12):1829-1833. ( Wu Xiaohui,Song Pingping,Zhang Rongxin. Research on Implementation Framework Model and Classification Based on Query Intention and Non-query Intention[J]. Information Science,2009,27(12):1829-1833)
[8]袁鼎荣,钟宁,张师超. 文本信息处理研究述评[J]. 计算机科学,2011,38(2):9-13. ( Yuan Dingrong,Zhong Ning,Zhang Shichao. Research on Text Information Processing Review[J]. Computer Science,2011,38(2):9-13.)
[9]Li X,Wang Y Y,Acero A. Learning Query Intent from Regularized Click Graphs[C]. In:Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York,NY,USA:ACM,2008:339-346.
[10]王大玲,于戈,鲍玉斌,等. 基于用户搜索意图的Web网页动态泛化[J]. 软件学报,2010,21(5):1083-1097. (Wang Daling,Yu Ge,Bao Yubin,et al. Dynamically Generalizing Web Pages Based on Users’ Search Intentions[J]. Journal of Software,2010,21(5):1083-1097.)
[11]修驰,宋柔.基于无监督学习的专业领域分词歧义消解方法[J]. 计算机应用,2013,33(3):780-783. (Xiu Chi,Song Rou. Disambiguation of Domain Word Segmentation Based on Unsupervised Learning[J]. Journal of Computer Applications,2013,33(3):780-783.)
[12]伍大勇,赵世奇,刘挺,等. 融合多类特征识别Web搜索意图识别[J]. 模式识别与人工智能,2012,25(3):500-505. (Wu Dayong,Zhao Shiqi,Liu Ting,et al. Identification of Query Intents via Combining Multiple Features[J]. Pattern Recognition and Artificial Intelligence,2012,25(3):500- 505.)
[13]陈翀,刘晓兵,徐谷子,等.一种搜索引擎的查询意图发现的新方法[J]. 情报学报,2012,31(3):242-249. ( Chen Chong,Liu Xiaobing,Xu Guzi,et al. A New Method of Detecting Query Intent for Search Engines[J]. Journal of the China Society for Scientific and Technical Information,2012,31(3):242-249.)
[1] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[2] 孟镇,王昊,虞为,邓三鸿,张宝隆. 基于特征融合的声乐分类研究*[J]. 数据分析与知识发现, 2021, 5(5): 59-70.
[3] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[4] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[5] 孙海霞, 王蕾, 吴英杰, 华薇娜, 李军莲. 科技文献数据库中机构名称匹配策略研究*[J]. 数据分析与知识发现, 2018, 2(8): 88-97.
[6] 杨超凡, 邓仲华, 彭鑫, 刘斌. 近5年信息检索的研究热点与发展趋势综述*——基于相关会议论文的分析[J]. 数据分析与知识发现, 2017, 1(7): 35-43.
[7] 张晓娟, 韩毅. 时态信息检索研究综述*[J]. 数据分析与知识发现, 2017, 1(1): 3-15.
[8] 黄名选. 基于矩阵加权关联模式的印尼中跨语言信息检索模型*[J]. 数据分析与知识发现, 2017, 1(1): 26-36.
[9] 任珂,陆伟,丁恒. 查询专指度对检索效果的影响研究[J]. 现代图书情报技术, 2016, 32(11): 34-43.
[10] 丁恒, 陆伟. 基于相关性的跨模态信息检索研究*[J]. 现代图书情报技术, 2016, 32(1): 17-23.
[11] 吴丹, 向雪. 社群环境下的协同信息检索行为实验研究[J]. 现代图书情报技术, 2014, 30(12): 1-9.
[12] 邱均平, 方国平. 基于知识图谱的中外自然语言处理研究的对比分析[J]. 现代图书情报技术, 2014, 30(12): 51-61.
[13] 吴丹,余文婷. 国外协同信息检索系统比较分析*[J]. 现代图书情报技术, 2014, 30(1): 14-23.
[14] 张梅, 段建勇, 徐骥超. 人名属性知识挖掘及其在查询分类中的应用[J]. 现代图书情报技术, 2013, 29(9): 82-87.
[15] 周姗姗, 毕强, 高俊峰. 基于社会网络分析的信息检索结果可视化呈现方法研究[J]. 现代图书情报技术, 2013, 29(11): 81-85.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn