%A 杨林, 黄晓硕, 王嘉阳, 李姣 %T 基于语义对齐的临床量表信息提取方法及其临床试验队列识别的应用研究* %0 Journal Article %D 2020 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2020.0951 %P 33-44 %V 4 %N 12 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4988.shtml} %8 2020-12-25 %X

【目的】 面向真实世界数据驱动的临床研究需求,提出一种基于语义对齐的临床量表信息提取方法,辅助识别潜在受试人群。【方法】 选取卒中量表NIHSS,分析量表信息在临床试验和真实世界电子病历中的特征,构建基于语义对齐的量表信息提取方法,应用临床试验数据集(ClinicalTrials.gov)和开放电子病历数据集MIMIC-III开展实验验证。【结果】 从患者出院小结中抽取NIHSS总评分、检查项评分的F1值分别为0.953 5和0.926 7;围绕两项匹配NIHSS纳排标准的测试任务,可以有效地识别出潜在受试人群。【局限】 缺乏在其他量表上的可行性研究,以及在真实临床试验环境中的有效性和可靠性验证。【结论】 本方法可以有效地解决临床量表信息在临床研究与电子病历数据的语义一致性问题。