Please wait a minute...
Advanced Search
数据分析与知识发现
  本期目录 | 过刊浏览 | 高级检索 |
知识增强的生物医学文本生成式摘要研究
邓 露,胡 珀,李炫宏
(华中师范大学人工智能与智慧学习湖北省重点实验室 武汉  430079) (华中师范大学计算机学院 武汉  430079) (国家语言资源监测与研究网络媒体中心 武汉  430079)
Biomedical Abstractive Summarization Based on Knowledge Enhancement
Deng Lu,Hu Po,Li Xuanhong
(Hubei Provincial Key Laboratory of Artificial Intelligence and Smart Learning, Central China Normal University, Wuhan 430079, China) (School of Computer Science, Central China Normal University, Wuhan 430079, China) (National Language Resources Monitoring & Research Center for Network Media, Central China Normal University, Wuhan 430079, China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

[目的] 将生物医学文本映射到生物医学领域超级叙词表以获得文本中包含的生物医学术语及其对应概念,并将术语和概念作为背景知识融入到文本摘要模型中,以提高文本摘要模型在生物医学文本上的摘要生成质量。

[方法] 该方法先通过抽取式摘要技术获取文本的重要内容,然后结合生物医学领域知识库将文本重要内容中包含的术语与其对应的知识库概念一并抽取出来,作为背景知识融入到神经网络生成式摘要模型的注意力机制中,使模型在领域知识引导下既可聚焦文本内部的重要信息,又可抑制因外部信息引入而可能产生的噪音问题,显著改善摘要的生成质量。

[结果] 在三个生物医学领域数据集上的实验结果验证了所提方法的有效性,本文所提模型PG-meta在三个数据集上的ROUGE均值达到31.06,比原PG模型ROUGE均值高1.51。

[局限] 仍有待进一步探索不同的生物医学领域背景知识获取方式对于模型增强效果的影响。

[结论] 所提方法可帮助模型更好的学习生物医学文本深层含义,提高摘要生成质量。


服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 生物医学文本挖掘生成式摘要领域知识知识增强     
Abstract

[Objective] Mapping the biomedical text to the super thesaurus in the biomedical field to obtain the biomedical terms contained in the text and their corresponding concepts, and integrate the terms and concepts as background knowledge into the text summary model to improve the text summary model in biomedicine The quality of the summary generation on the text.

[Methods] This method first obtains the important content of the text through extractive abstract technology, and then combines the important content of the text with the knowledge base in the biomedical field to extract the terms contained in the important content of the text and its corresponding knowledge base concept, and integrate it into the neural network generative abstract as background knowledge In the attention mechanism of the model, the model can not only focus on the important information inside the text under the guidance of domain knowledge, but also suppress the noise problems that may occur due to the introduction of external information, and significantly improve the quality of abstract generation.

[Results] The experimental results on three biomedical field data sets verify the effectiveness of the proposed method. The average ROUGE of the proposed model PG-meta on the three data sets reaches 31.06, which is 1.51 higher than the average ROUGE of the original PG model.

[Limitations] The impact of different ways of acquiring background knowledge in biomedical fields on the effectiveness of model enhancement remains to be further explored.

[Conclusions] The proposed method can help the model better learn the deep meaning of biomedical texts and improve the quality of abstract generation.


Key words Biomedical text mining    generative abstract    domain knowledge    knowledge enhancement
     出版日期: 2022-07-01
ZTFLH:  TP393,G250  
引用本文:   
邓 露, 胡 珀, 李炫宏. 知识增强的生物医学文本生成式摘要研究 [J]. 数据分析与知识发现, 10.11925/infotech.2096-3467.2022-0034.
Deng Lu, Hu Po, Li Xuanhong. Biomedical Abstractive Summarization Based on Knowledge Enhancement . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2022-0034      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 李雪思, 张智雄, 王宇飞, 刘熠. 领域知识演化分析方法综述*[J]. 数据分析与知识发现, 2024, 8(1): 1-15.
[2] 裴伟, 孙水发, 李小龙, 鲁际, 杨柳, 吴义熔. 融合领域知识的医学命名实体识别研究*[J]. 数据分析与知识发现, 2023, 7(3): 142-154.
[3] 景慎旗, 赵又霖. 基于医学领域知识和远程监督的医学实体关系抽取研究*[J]. 数据分析与知识发现, 2022, 6(6): 105-114.
[4] 邓露,胡珀,李炫宏. 知识增强的生物医学文本生成式摘要研究*[J]. 数据分析与知识发现, 2022, 6(11): 1-12.
[5] 贾明华, 王秀利. 基于BERT和互信息的金融风险逻辑关系量化方法[J]. 数据分析与知识发现, 2022, 6(10): 68-78.
[6] 王义真,欧石燕,陈金菊. 民事裁判文书两阶段式自动摘要研究*[J]. 数据分析与知识发现, 2021, 5(5): 104-114.
[7] 陈果, 肖璐. 网络社区中的知识元链接体系构建研究*[J]. 数据分析与知识发现, 2017, 1(11): 75-83.
[8] 胡新明, 罗建军, 夏火松. 基于商品领域知识的交互式推荐系统[J]. 现代图书情报技术, 2014, 30(10): 56-62.
[9] 宋文, 黄金霞, 刘毅, 汤怡洁. 面向知识发现的SKE关键技术及服务[J]. 现代图书情报技术, 2012, 28(7): 13-18.
[10] 沈东婧, 许咏丽, 夏勃. 面向植物领域科学家网络应用研究与实践[J]. 现代图书情报技术, 2012, 28(7): 27-32.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn