Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. 29 Issue (9): 82-87     https://doi.org/10.11925/infotech.1003-3513.2013.09.13
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
人名属性知识挖掘及其在查询分类中的应用
张梅, 段建勇, 徐骥超
北方工业大学信息工程学院 北京 100144
Person Name Attribute Knowledge Mining and Its Application for Query Classification
Zhang Mei, Duan Jianyong, Xu Jichao
College of Information Engineering, North China University of Technology, Beijing 100144, China
全文: PDF (533 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 网络日志中存在大量的命名实体类查询,而其中人名查询占到近半的比例。提出运用网络查询日志和维基百科知识构建人名知识库,并应用于查询分类。通过抽取查询日志中的人名实体,并结合百科知识充实实体属性知识,形成包含属性知识的人名知识库。根据高质量的属性模板和统计分类方法对查询中的人名进行分类,在查询推荐中依据不同人物分类知识库进行分类推荐。实验结果表明该知识库对查询串中的人名实体能进行有效分类。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张梅
段建勇
徐骥超
关键词 属性挖掘查询分类信息检索    
Abstract:There are many name entity queries in the Web logs, and person name queries are more than half of these queries. This paper uses Web logs and Wikipedia information to construct the person name knowledge base for the query recommendation. Firstly the person name entities are mined from Web logs and the attributes of these entities are combined by extracting from Wikipedia. With the help of the person name knowledge, the person names in the user queries are classified by the attribute patterns and statistic methods. Then related attribute knowledge is used to recommend the user Intents. The results show that the person name knowledge can be used effectively in the query classification.
Key wordsAttribute mining    Query classification    Information retrieval
收稿日期: 2013-05-27      出版日期: 2013-09-27
:  TP393  
基金资助:本文系国家社会科学基金项目“基于网络日志的知识地图构建及其应用研究”(项目编号:11CTQ036)、国家自然科学基金项目“面向维基百科的多粒度一体化信息抽取方法研究”(项目编号:61103112)和教育部人文社会科学基金项目“属性知识在复合结构语义分析中的应用研究”(项目编号:10YJC740132)的研究成果之一。
通讯作者: 段建勇     E-mail: duanjy@hotmail.com
引用本文:   
张梅, 段建勇, 徐骥超. 人名属性知识挖掘及其在查询分类中的应用[J]. 现代图书情报技术, 2013, 29(9): 82-87.
Zhang Mei, Duan Jianyong, Xu Jichao. Person Name Attribute Knowledge Mining and Its Application for Query Classification. New Technology of Library and Information Service, 2013, 29(9): 82-87.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.09.13      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2013/V29/I9/82
[1] Chen L, Feng Y, Chen Y, et al.Towards Automatic Construction of Knowledge Bases from Chinese Online Resources[C].In: Proceedings of ACL 2012 Student Research Workshop (ACL’12). Stroudsburg: Association for Computational Linguistics,2012:67-72.
[2] 齐振宇, 刘康, 赵军. 一种融合实体语义知识的实体集合扩展方法[J]. 中文信息学报,2013,27(2): 1-9.(Qi Zhenyu, Liu Kang, Zhao Jun. A Novel Entity Set Expansion Method Leveraging Entity Semantic Knowledge[J].Journal of Chinese Information Processing,2013,27(2):1-9.)
[3] 张梅,段建勇. 概念与属性间语义约束知识的获取方法研究[J]. 语言文字应用,2012(1): 133-140.(Zhang Mei,Duan Jianyong. The Constraint Knowledge Extraction from the Concept and Its Attributions[J]. Applied Linguistics, 2012(1):133-140.)
[4] Chen Y, Chen L, Xu K. Learning Chinese Entity Attributes from Online Encyclopedia[C].In: Proceedings of the 14th International Conference on Web Technologies and Applications (APWeb’12). Berlin,Heidelberg: Springer-Verlag,2012:179-186.
[5] Liu H, Hu X, Zhao J, et al.Identification of Complex Named-Entities in Chinese Queries Using WWW[C].In: Proceedings of the 5th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD’08), Jinan, Shangdong,China.2008:180-185.
[6] 王莹莹, 白宇, 丁长林, 等. 面向语义检索的中医理论知识库构建方法的研究[J]. 中文信息学报,2012,26(5):72-78.(Wang Yingying, Bai Yu, Ding Changlin, et al. Construction of TCM Theoretical Knowledge Base for Semantic Retrieval[J].Journal of Chinese Information Processing,2012,26(5): 72-78.)
[7] 杨锐, 汤怡洁, 刘毅,等. Web环境中的本体构建系统研究综析[J]. 现代图书情报技术, 2012 (1):13-18.(Yang Rui, Tang Yijie, Liu Yi, et al. Comprehensive Evaluation of the Ontology Building System in the Web Environment[J]. New Technology of Library and Information Service, 2012 (1):13-18.)
[8] 翟海军, 郭嘉丰, 王小磊,等. 基于用户查询日志的命名实体挖掘[J]. 中文信息学报, 2010, 24(1):71-76.(Zhai Haijun, Guo Jiafeng, Wang Xiaolei, et al. Mining Named Entities from Query Logs[J]. Journal of Chinese Information Processing, 2010, 24(1):71-76.)
[9] 张晓芳, 李国徽,庞永杰. 面向Web社会网络搜索的人名同一性判断[J]. 计算机工程与科学, 2012,34(9): 128-134.(Zhang Xiaofang, Li Guohui, Pang Yongjie. Identical Name Judgment Based on Web Social Network Search[J]. Computer Engineering & Science,2012,34(9):128-134.)
[10] 陆伟, 周红霞,张晓娟. 查询意图研究综述[J]. 中国图书馆学报,2013,39(1): 100-111.(Lu Wei,Zhou Hongxia, Zhang Xiaojuan. Review of Research on Query Intent[J]. Journal of Library Science in China, 2013,39(1): 100-111.)
[11] 王超, 朱彤, 刘奕群,等. 构建查询需求形式分类体系[J]. 中文信息学报, 2012,26(6):116-120. (Wang Chao, Zhu Tong, Liu Yiqun, et al. Classification System for Query Needs Type[J].Journal of Chinese Information Processing, 2012,26(6): 116-120.)
[12] 陈翀, 刘晓兵, 徐谷子, 等. 一种搜索引擎的查询意图发现的新方法[J]. 情报学报, 2012,31(3):242-249.(Chen Chong, Liu Xiaobing, Xu Guzi, et al. A New Method of Detecting Query Intent for Search Engines[J]. Journal of the China Society for Scientific and Technical Information,2012,31(3): 242-249.)
[13] 王建冬,王继民. 基于日志挖掘的高校用户期刊数据库检索行为研究[J]. 北京大学学报:自然科学版,2012,48(1):29-36.(Wang Jiandong, Wang Jimin. Study on Journal Database Retrieve Behavior of University Users Based on Log Mining[J]. Acta Scientiarum Naturalium Universitatis Pekinensis,2012,48(1):29-36.)
[14] 岳峰, 孙亮, 王宽全, 等. 利用构建语义词典的查询自动分类方法[J]. 哈尔滨工业大学学报,2008,40(7):1094-1098.(Yue Feng, Sun Liang, Wang Kuanquan,et al. Automatic Query Classification via Constructing Semantic Lexicon[J]. Journal of Harbin Institute of Technology,2008,40(7):1094-1098.)
[1] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[2] 孟镇,王昊,虞为,邓三鸿,张宝隆. 基于特征融合的声乐分类研究*[J]. 数据分析与知识发现, 2021, 5(5): 59-70.
[3] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[4] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[5] 孙海霞, 王蕾, 吴英杰, 华薇娜, 李军莲. 科技文献数据库中机构名称匹配策略研究*[J]. 数据分析与知识发现, 2018, 2(8): 88-97.
[6] 杨超凡, 邓仲华, 彭鑫, 刘斌. 近5年信息检索的研究热点与发展趋势综述*——基于相关会议论文的分析[J]. 数据分析与知识发现, 2017, 1(7): 35-43.
[7] 张晓娟, 韩毅. 时态信息检索研究综述*[J]. 数据分析与知识发现, 2017, 1(1): 3-15.
[8] 黄名选. 基于矩阵加权关联模式的印尼中跨语言信息检索模型*[J]. 数据分析与知识发现, 2017, 1(1): 26-36.
[9] 丁恒, 陆伟. 基于相关性的跨模态信息检索研究*[J]. 现代图书情报技术, 2016, 32(1): 17-23.
[10] 吴丹, 向雪. 社群环境下的协同信息检索行为实验研究[J]. 现代图书情报技术, 2014, 30(12): 1-9.
[11] 邱均平, 方国平. 基于知识图谱的中外自然语言处理研究的对比分析[J]. 现代图书情报技术, 2014, 30(12): 51-61.
[12] 吴丹,余文婷. 国外协同信息检索系统比较分析*[J]. 现代图书情报技术, 2014, 30(1): 14-23.
[13] 唐静笑,吕学强,柳成洋,李涵. 用户查询意图的层次化识别方法*[J]. 现代图书情报技术, 2014, 30(1): 36-42.
[14] 周姗姗, 毕强, 高俊峰. 基于社会网络分析的信息检索结果可视化呈现方法研究[J]. 现代图书情报技术, 2013, 29(11): 81-85.
[15] 马军红. 分阶段融合的文本语义相似度计算方法[J]. 现代图书情报技术, 2013, 29(10): 20-26.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn