Please wait a minute...
Advanced Search
数据分析与知识发现
  本期目录 | 过刊浏览 | 高级检索 |
近十年信息检索领域的研究热点与演化趋势研究── 基于SIGIR会议论文的分析
李跃艳,王昊,邓三鸿,王伟
(南京大学信息管理学院,南京 210023)
(江苏省数据工程与知识服务重点实验室,南京 210023)
Research on The Research Hotspots and Evolution Trends in The Field of Information Retrieval in The Past Ten Years─ Based on The Analysis of SIGIR Conference Papers
Li Yueyan,Wang Hao,Deng Sanhong,Wang Wei
School of Information Management, Nanjing University, Nanjing 210023
Jiangsu Key Laboratory of Data Engineering & Knowledge Service, Nanjing 210023
全文: PDF (1580 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]实时准确地了解信息检索领域的研究热点和演化趋势,有助于为本领域的研究人员提供参考和帮助,对于加速与交叉学科的融合,促进信息检索技术的快速应用具有至关重要的作用。[方法]本文以SIGIR年会2008-2019年的录用论文作为数据源。首先,采用LDA模型识别并生成主题;其次,根据文献与主题的相似度过滤边缘文献,并通过计算文献主题区分度进行文档多主题划分;接着,通过构建领域主题在时间序列上的演化路径,展示主题的上升、下降及稳定3种演化方式;最后,通过模块化社团结构发现,构建单一主题的细粒度演化路径,充分展示主题群落内部知识单元间的动态演化过程。[结果]本文方法避免了边缘文献对领域主题识别和演化路径造成的干扰,文献多主题划分有助于揭示主题之间的交叉融合。研究发现,目前信息检索领域主要以用户为中心,检索模型不断优化,注重过滤和推荐,注重语义网技术,深度学习方法得到广泛应用,医疗健康等应用领域逐渐成为信息检索领域重点关注的内容。[局限]在过滤边缘文献和文献多主题划分时,通过设置阈值, 具有一定的主观性。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 信息检索领域LDA社会网络分析主题演变     
Abstract

[Objective] Real-time and accurate understanding of the research hotspots and evolution trends in the field of information retrieval is helpful to provide reference and assistance to researchers, which is crucial for accelerating the integration of interdisciplinary and promoting the rapid application of information retrieval technology. [Method] This article uses the accepted papers of the SIGIR Annual Conference from 2008 to 2019 as the data source. First, the LDA model is used to identify and generate topics. Second, filtering irrelevant documents according to the similarity between documents and topics, and dividing documents into multiple topics by calculating document topic discrimination; Third, by constructing the evolution path of the domain topics in the time series to show the three evolution methods, including persistence, weakening and stability; finally, through the modular community, the fine-grained evolution path of a single topic is constructed to fully demonstrate the dynamic evolution process between knowledge units within the topic. [Results] The method proposed in this paper avoids the interference caused by irrelevant documents on the topics identification and evolution path, and the multi-topic division of documents helps reveal the cross-fusion between topics. The current information retrieval field is mainly user-centric; retrieval models are continuously optimized, focusing on filtering and recommendation, focusing on semantic web technology, deep learning methods are widely used, application fields such as medical and health have gradually become the focus of the information retrieval field. [Limitations] It has a certain degree of subjectivity when filtering irrelevant documents and document multi-topic division by setting a threshold.

Key words information retrieval field    LDA    social network analysis    topics evolution
     出版日期: 2020-12-15
引用本文:   
李跃艳, 王昊, 邓三鸿, 王伟. 近十年信息检索领域的研究热点与演化趋势研究── 基于SIGIR会议论文的分析 [J]. 数据分析与知识发现, 10.11925/infotech.2096-3467.2020.1164.
Li Yueyan, Wang Hao, Deng Sanhong, Wang Wei. Research on The Research Hotspots and Evolution Trends in The Field of Information Retrieval in The Past Ten Years─ Based on The Analysis of SIGIR Conference Papers . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2020.1164      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 蔡永明,刘璐,王科唯. 网络虚拟学习社区重要用户与核心主题联合分析*[J]. 数据分析与知识发现, 2020, 4(6): 69-79.
[2] 叶光辉,曾杰妍,胡婧岚,毕崇武. 城市画像视角下的社会公众情感演化研究*[J]. 数据分析与知识发现, 2020, 4(4): 15-26.
[3] 潘有能,倪秀丽. 基于Labeled-LDA模型的在线医疗专家推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 34-43.
[4] 刘玉文,王凯. 面向地域的网络话题识别方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 173-181.
[5] 叶光辉,徐彤,毕崇武,李心悦. 基于多维度特征与LDA模型的城市旅游画像演化分析*[J]. 数据分析与知识发现, 2020, 4(11): 121-130.
[6] 黄微,赵江元,闫璐. 网络热点事件话题漂移指数构建与实证研究*[J]. 数据分析与知识发现, 2020, 4(11): 92-101.
[7] 王晰巍,张柳,黄博,韦雅楠. 基于LDA的微博用户主题图谱构建及实证研究*——以“埃航空难”为例[J]. 数据分析与知识发现, 2020, 4(10): 47-57.
[8] 关鹏,王曰芬. 国内外专利网络研究进展*[J]. 数据分析与知识发现, 2020, 4(1): 26-39.
[9] 邵云飞,刘东苏. 基于类别特征扩展的短文本分类方法研究 *[J]. 数据分析与知识发现, 2019, 3(9): 60-67.
[10] 孙明珠,马静,钱玲飞. 基于文档主题结构和词图迭代的关键词抽取方法研究 *[J]. 数据分析与知识发现, 2019, 3(8): 68-76.
[11] 夏立新,曾杰妍,毕崇武,叶光辉. 基于LDA主题模型的用户兴趣层级演化研究 *[J]. 数据分析与知识发现, 2019, 3(7): 1-13.
[12] 关鹏,王曰芬,傅柱. 基于LDA的主题语义演化分析方法研究 * ——以锂离子电池领域为例[J]. 数据分析与知识发现, 2019, 3(7): 61-72.
[13] 席林娜,窦永香. 基于计划行为理论的微博用户转发行为影响因素研究*[J]. 数据分析与知识发现, 2019, 3(2): 13-20.
[14] 张杰,赵君博,翟东升,孙宁宁. 基于主题模型的微藻生物燃料产业链专利技术分析*[J]. 数据分析与知识发现, 2019, 3(2): 52-64.
[15] 钟庆虹,乔晓东,张运良,翁梦娟. 基于LDA2Vec和残差网络的跨媒体融合方法研究 *[J]. 数据分析与知识发现, 2019, 3(10): 78-88.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn