Please wait a minute...
Advanced Search
数据分析与知识发现  0, Vol. Issue (): 1-     https://doi.org/10.11925/infotech.2096-3467. 2020.0382
  本期目录 | 过刊浏览 | 高级检索 |
命名实体消歧研究进展综述
温萍梅,叶志炜,丁文健,刘颖,徐健
(中山大学资讯管理学院,广州 510006)
(中山大学图书馆,广州 510275)
Literature Review on the Progress of Named Entity Disambiguation Research
Wen Pingmei,Ye Zhiwei,Ding Wenjian,Liu Ying,Xu Jian
(School of Information management, Sun Yat-sen University, Guangzhou 510006)
(Sun Yat-sen University Library, Guangzhou 510275)
全文: PDF (947 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]调研近年来命名实体消歧领域的相关研究和资源,重点介绍命名实体消歧方法研究进展。

[文献范围]使用知网数据库、万方数据知识服务平台和EBSCO外文期刊平台检索命名实体消歧相关文献,共选择57篇代表性文献和电子资源。

[方法]本文从实体显著性、上下文相似度、实体关联度、深度学习和特殊标识资源五个角度对命名实体消歧的方法和思路进行归纳总结,并对可用的辅助知识库和开源工具以及国际评测会议进行梳理。

[结果]传统的方法经典易用,而近年来出现的深度学习等新方法,则明显地提升了消歧效果。有效的消歧模型往往整合了不同类型方法,以期达到最优消歧效果。

[局限]基于已有文献对各种方法的对比分析尚存在一定的主观性。

[结论]现有的命名实体消歧方法仍然处在发展阶段,未来可利用人工智能方法和领域资源进一步提升实体消歧效果。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 命名实体消歧  知识库  实体链接  聚类     
Abstract

[Objective] This paper reviews the related researches and resources in the field of named entity disambiguation (NED) focusing on the research progress of NED methods.

[Coverage] We reviewed a total of 57 papers and electronic resources from CNKI, Wanfang Data Knowledge Service Platform, and EBSCO.

[Methods] We first teases out the available thought and method for NED in terms of entity prominence, context similarity, entity relationship, deep learning and special identification resources. Next, some useful knowledge bases, open source tools as well as international conferences on NED evaluation are listed and discussed here.

[Results] Traditional methods are classic and easy to use, while new methods such as deep learning, which have emerged in recent years, have significantly improved the disambiguation effect. Effective disambiguation models often integrate different types of methods in order to achieve the optimal disambiguation effect.

[Limitations] There is still subjectivity in the comparative analysis of different methods based on the existing literature.

[Conclusions] The existing NED methods are still in the development stage. Artificial intelligence methods and field resources can be used to further improve the entity disambiguation effect in the future.

Key words Named Entity Disambiguation    Knowledge Base    Entity Linking    Cluster
     出版日期: 2020-06-22
ZTFLH:  TP393,G250  
引用本文:   
温萍梅, 叶志炜, 丁文健, 刘颖, 徐健. 命名实体消歧研究进展综述 [J]. 数据分析与知识发现, 0, (): 1-.
Wen Pingmei, Ye Zhiwei, Ding Wenjian, Liu Ying, Xu Jian. Literature Review on the Progress of Named Entity Disambiguation Research . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467. 2020.0382      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 邬金鸣,侯跃芳,崔雷. 基于医学主题词标引规则的词共现聚类分析结果自动判读和表达的研究[J]. 数据分析与知识发现, 2020, 4(9): 133-144.
[2] 温萍梅,叶志炜,丁文健,刘颖,徐健. 命名实体消歧研究进展综述*[J]. 数据分析与知识发现, 2020, 4(9): 15-25.
[3] 席运江, 杜蝶蝶, 廖晓, 仉学红. 基于超网络的企业微博用户聚类研究及特征分析*[J]. 数据分析与知识发现, 2020, 4(8): 107-118.
[4] 杨旭,钱晓东. 基于改进的Vicsek模型的社会网络同步聚类算法*[J]. 数据分析与知识发现, 2020, 4(4): 119-128.
[5] 熊回香,李晓敏,李跃艳. 基于图书评论属性挖掘的群组推荐研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 214-222.
[6] 魏家泽,董诚,何彦青,刘志辉,彭柯芸. 基于均衡段落和分话题向量的新闻热点话题检测研究*[J]. 数据分析与知识发现, 2020, 4(10): 70-79.
[7] 赵华茗,余丽,周强. 基于均值漂移算法的文本聚类数目优化研究 *[J]. 数据分析与知识发现, 2019, 3(9): 27-35.
[8] 李珊,姚叶慧,厉浩,刘洁,嘎玛白姆. 基于ISA联合聚类的组推荐算法研究 *[J]. 数据分析与知识发现, 2019, 3(8): 77-87.
[9] 李柯,佐々木勇和. 基于多维小波聚类的空间文本数据情感分布分析[J]. 数据分析与知识发现, 2019, 3(7): 14-22.
[10] 周成,魏红芹. 专利价值评估与分类研究*——基于自组织映射支持向量机[J]. 数据分析与知识发现, 2019, 3(5): 117-124.
[11] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[12] 吴江,赵颖慧,高嘉慧. 医疗舆情事件的微博意见领袖识别与分析研究*[J]. 数据分析与知识发现, 2019, 3(4): 53-62.
[13] 肖连杰,郜梦蕊,苏新宁. 一种基于模糊C-均值聚类的欠采样集成不平衡数据分类算法*[J]. 数据分析与知识发现, 2019, 3(4): 90-96.
[14] 叶佳鑫,熊回香. 基于标签的跨领域资源个性化推荐研究*[J]. 数据分析与知识发现, 2019, 3(2): 21-32.
[15] 毕崇武,叶光辉,李明倩,曾杰妍. 基于标签语义挖掘的城市画像感知研究 *[J]. 数据分析与知识发现, 2019, 3(12): 41-51.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn