Please wait a minute...
Advanced Search
数据分析与知识发现  0, Vol. Issue (): 1-     https://doi.org/10.11925/infotech.2020.0951
  本期目录 | 过刊浏览 | 高级检索 |
基于语义对齐的临床量表信息提取方法及其临床试验队列识别的应用研究
杨林,黄晓硕,王嘉阳,李姣
(中国医学科学院/北京协和医学院,医学信息研究所/图书馆 北京  100020)
Semantic Alignment-based Clinical Scale Information Extraction and its Application in Cohort Identification
Yang Lin,Huang Xiaoshuo,Wang Jiayang,Li Jiao
(Institute of Medical Information/Medical Library, Chinese Academy of Medical Science & Peking Union Medical College, Beijing 100020, China)
全文: PDF (1027 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的] 面向真实世界数据驱动的临床研究需求,提出一种基于语义对齐的临床量表信息提取方法,辅助识别潜在受试人群。[方法] 选取卒中量表NIHSS,分析量表信息在临床试验和真实世界电子病历中的特征,构建基于语义对齐的量表信息提取方法,应用临床试验数据集(ClinicalTrials.gov)和开放电子病历数据集MIMIC-III开展实验验证。[结果] 从患者出院小结中抽取NIHSS总评分、检查项评分的F1值分别为0.9535和0.9267;围绕两项匹配NIHSS纳排标准的测试任务,可以有效地识别出潜在受试人群。[局限] 缺乏在其他量表上的可行性研究,以及在真实临床试验环境中的有效性和可靠性验证。[结论] 本研究方法可以有效地解决临床量表信息在临床研究与电子病历数据的语义一致性问题。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 语义对齐临床量表临床试验纳排标准队列识别     
Abstract

[Objective] To meet the real world data-driven clinical research, this study aimed to develop a clinical scale information extraction method based on semantic alignment, which could facilitate cohort identification. [Methods] The NIHSS (National Institutes of Health Stroke Scale) was used in this study. We analyzed its features in both clinical trials and real-world electronic medical records. Thereafter, a semantic alignment-based clinical scale information extraction method was proposed, and validated on the clinical trials data (ClinicalTrials.gov) and the open electronic medical record dataset MIMIC-III. [Results] The F1 values of the NIHSS total score and item scores extraction were 0.9535 and 0.9267, respectively. Besides, we could identify patients who met NIHSS criteria effectively in two test tasks. [Limitations] The method feasibility for other clinical scales did not be validated. Also, the method should be applied in the real-world trial recuriment scenario for furher improvement. [Conclusions] The proposed method showed to be an effective approach to solve the problem of semantic consistency of clinical scale information between clinical research and electronic medical record data.

Key words Semantic Alignment    Clinical Scale    Clinical Trial    Eligible Criteria    Cohort Identification
     出版日期: 2020-10-23
ZTFLH:  TP391  
引用本文:   
杨林, 黄晓硕, 王嘉阳, 李姣. 基于语义对齐的临床量表信息提取方法及其临床试验队列识别的应用研究 [J]. 数据分析与知识发现, 0, (): 1-.
Yang Lin, Huang Xiaoshuo, Wang Jiayang, Li Jiao. Semantic Alignment-based Clinical Scale Information Extraction and its Application in Cohort Identification . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2020.0951      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 达婧玮,颜嘉麒,邓三鸿,王忠民. 基于深度学习的重复住院预测模型研究——以心脏病为例*[J]. 数据分析与知识发现, 2020, 4(11): 63-73.
[2] 丁勇,陈夕,蒋翠清,王钊. 一种融合网络表示学习与XGBoost的评分预测模型*[J]. 数据分析与知识发现, 2020, 4(11): 52-62.
[3] 王思丽,祝忠明,杨恒,刘巍. 基于模式和投影学习的领域概念上下位关系自动识别研究*[J]. 数据分析与知识发现, 2020, 4(11): 15-25.
[4] 叶光辉,徐彤,毕崇武,李心悦. 基于多维度特征与LDA模型的城市旅游画像演化分析*[J]. 数据分析与知识发现, 2020, 4(11): 121-130.
[5] 彭郴,吕学强,孙宁,张乐,姜肇财,宋黎. 基于CNN的消费品缺陷领域词典构建方法研究*[J]. 数据分析与知识发现, 2020, 4(11): 112-120.
[6] 刘婧茹,宋阳,贾睿,张翼鹏,罗勇,马敬东. 基于BiLSTM-CRF中文临床文本中受保护的健康信息识别*[J]. 数据分析与知识发现, 2020, 4(10): 124-133.
[7] 陈文杰. 基于翻译模型的科研合作预测研究*[J]. 数据分析与知识发现, 2020, 4(10): 28-36.
[8] 魏家泽,董诚,何彦青,刘志辉,彭柯芸. 基于均衡段落和分话题向量的新闻热点话题检测研究*[J]. 数据分析与知识发现, 2020, 4(10): 70-79.
[9] 余本功,汲浩敏. 基于DW-TCI的半监督文本分类方法研究*[J]. 数据分析与知识发现, 2020, 4(10): 58-69.
[10] 邵琦,牟冬梅,王萍,靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究*[J]. 数据分析与知识发现, 2020, 4(9): 68-80.
[11] 李广建,王锴,张庆芝. 基于多源数据的美国出口管制分析框架及其实证研究*[J]. 数据分析与知识发现, 2020, 4(9): 26-40.
[12] 叶光辉,徐彤. 基于演化分析的动态城市画像研究*[J]. 数据分析与知识发现, 2020, 4(9): 100-110.
[13] 叶光辉, 徐彤, 毕崇武, 李心悦. 基于多维度特征与LDA模型的城市旅游画像演化分析 [J]. 数据分析与知识发现, 0, (): 1-.
[14] 彭郴, 吕学强, 孙宁, 张乐, 姜肇财, 宋黎. 基于CNN的消费品缺陷领域词典构建方法研究 [J]. 数据分析与知识发现, 0, (): 1-.
[15] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn