Please wait a minute...
Advanced Search
数据分析与知识发现
  本期目录 | 过刊浏览 | 高级检索 |
联合关系上下文负采样的知识图谱嵌入
李智杰,王瑞,李昌华,张颉
(西安建筑科技大学信息与控制工程学院 西安  710055)
Knowledge Graph Embedding Based on Negative Sampling of Joint Relational Context
Li Zhijie,Wang Rui,Li Changhua,Zhang Jie
(School of Information and Control Engineering, Xi’an University of Architectural Science and Technology, Xi’an 710055, China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]针对当前基于翻译的知识图谱嵌入模型负采样质量偏低,影响知识图谱的有效嵌入,导致模型表征能力低、性能较差等问题,提出了一种联合关系上下文负采样的知识图谱模型。

[方法]首先从原始知识图谱中提取目标实例的邻居并生成上下文向量;然后根据相邻关系可提供给定实体性质或类型信息的特性,在负采样时利用Concat聚合函数对给定实体的关系上下文进行聚合,确定被替换实体的属性;最后结合TransE模型的三元组嵌入并选择相同属性的替换实体生成负例三元组,从而提高正负例三元组的相似度。

[结果] 实体链接中,在FB15k-237与 WN18RR数据集上相对于基准模型分别提升了15.3、26.7个百分点;同时在关系链接中提升了7个百分点。

[局限]在考虑邻居关系时只考虑了关系上下文的语义信息,难以确定相对位置,需要对其路径信息作进一步探索。

[结论]该采样策略通过提高替换实体与被替换实体间的相似性,从而提升了负例三元组的质量,使模型的准确率得到提升。


服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 知识图谱负采样策略实体链接关系链接     
Abstract

[Objective] Aiming at the problems of low negative sampling quality of current translation-based knowledge graph embedding models, which affects the effective embedding of knowledge graph and leads to low representation ability and poor performance, thus a knowledge graph model based on negative sampling in joint relational context was proposed.

[Methods] Firstly, the neighbor of the target instance is extracted from the original knowledge graph and the context vector is generated. Then, according to the properties of adjacent relations that can provide information about the nature or type of a given entity, the Concat aggregation function is used to aggregate the context of the given entity in negative sampling so as to determine the attributes of the entity to be replaced. Finally, the triple embedding of TransE model is combined with the substitution entities with the same attribute to generate negative triples, so as to improve the similarity of the positive and negative triples.

[Results] In the entity linking, the FB15K-237 and WN18RR datasets have improved by 15.3 and 26.7 percentage points respectively compared with the benchmark model. It also saw a 7 percent increase in the related links.

[Limitations] When considering the neighbor relationship, only the semantic information of the relational context is considered, making it hard to determine the relative position, thus the path information needs to be further explored.

[Conclusions] The sampling strategy improves the quality of negative three tuple by improving the similarity between the replaced entity and the entity to be replaced, thus the accuracy of the model gets effectively improved.

Key words knowledge graph    negative sampling strategy    entity link    relation link
     出版日期: 2022-08-19
ZTFLH:  TP391  
引用本文:   
李智杰, 王瑞, 李昌华, 张颉. 联合关系上下文负采样的知识图谱嵌入 [J]. 数据分析与知识发现, 10.11925/infotech.2096-3467.2022-0214.
Li Zhijie, Wang Rui, Li Changhua, Zhang Jie. Knowledge Graph Embedding Based on Negative Sampling of Joint Relational Context . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2022-0214      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 何玉, 张晓冬, 郑鑫. 基于SpERT-Aggcn模型的专利知识图谱构建研究*[J]. 数据分析与知识发现, 2024, 8(1): 146-156.
[2] 张志剑, 倪珍妮, 刘政昊, 夏苏迪. 面向金融知识图谱的动态关系预测方法研究*[J]. 数据分析与知识发现, 2023, 7(9): 39-50.
[3] 普祥和, 王红斌, 线岩团. 结合类型感知注意力的少样本知识图谱补全*[J]. 数据分析与知识发现, 2023, 7(9): 51-63.
[4] 翟东升, 娄莹, 阚慧敏, 何喜军, 梁国强, 马自飞. 基于多源异构数据的中医药知识图谱构建与应用研究*[J]. 数据分析与知识发现, 2023, 7(9): 146-158.
[5] 汪晓凤, 孙雨洁, 王华珍, 张恒彰. 融合深度学习和知识图谱的类型可控问句生成模型构建及验证*[J]. 数据分析与知识发现, 2023, 7(6): 26-37.
[6] 李锴君, 牛振东, 时恺泽, 邱萍. 基于学术知识图谱及主题特征嵌入的论文推荐方法*[J]. 数据分析与知识发现, 2023, 7(5): 48-59.
[7] 王寅秋, 虞为, 陈俊鹏. 融合知识图谱的中文医疗问答社区自动问答研究*[J]. 数据分析与知识发现, 2023, 7(3): 97-109.
[8] 杜悦, 常志军, 董美, 钱力, 王颖. 一种面向海量科技文献数据的大规模知识图谱构建方法*[J]. 数据分析与知识发现, 2023, 7(2): 141-150.
[9] 张贞港, 余传明. 基于实体与关系融合的知识图谱补全模型研究*[J]. 数据分析与知识发现, 2023, 7(2): 15-25.
[10] 陈玲洪, 潘晓华. 基于知识图谱和读者画像的图书推荐研究*[J]. 数据分析与知识发现, 2023, 7(12): 164-171.
[11] 华斌, 位梦涵. 伤害类犯罪案由推理辅助决策方法研究与实践[J]. 数据分析与知识发现, 2023, 7(12): 142-154.
[12] 刘帅, 傅丽芳. 融合外部知识和用户交互特征的虚假新闻检测[J]. 数据分析与知识发现, 2023, 7(11): 79-87.
[13] 彭成, 张春霞, 张鑫, 郭倞涛, 牛振东. 基于实体多元编码的时序知识图谱推理*[J]. 数据分析与知识发现, 2023, 7(1): 138-149.
[14] 张晗, 安欣宇, 刘春鹤. 基于多源语义知识图谱的药物知识发现:以药物重定位为实证*[J]. 数据分析与知识发现, 2022, 6(7): 87-98.
[15] 刘春江, 李姝影, 胡汗林, 方曙. 图数据库在复杂网络分析中的研究与应用进展*[J]. 数据分析与知识发现, 2022, 6(7): 1-11.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn