%A 王寒雪,崔文娟,周园春,杜一 %T 基于机器学习的食源性疾病致病菌识别方法* %0 Journal Article %D 2021 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2020.1105 %P 54-62 %V 5 %N 9 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4954.shtml} %8 2021-09-25 %X

【目的】 引入外部食品领域数据增强暴露食品的词向量表征,利用机器学习方法对食源性疾病致病菌进行识别。【方法】 通过从食源性疾病病例数据中提取出空间、时间、患者信息、暴露食品信息等作为食源性疾病致病菌识别的特征数据,并进一步利用融合领域知识的词向量表征等技术对食源性疾病暴露食品进行表征,使用XGBoost机器学习模型挖掘、学习特征之间的相关性,从而实现对几种重要的食源性疾病致病菌的识别。【结果】 通过融合领域数据的词向量表征方法,可以获得比基于通用语料的词向量模型更加准确的暴露食品词向量表征。对沙门氏菌、诺如病毒、致泻大肠埃希氏菌属、副溶血性弧菌4种重要的食源性疾病致病菌的识别能够达到68%的精确率和召回率,为食源性疾病致病菌的辅助诊疗提供帮助。【局限】 仅对4种主要食源性疾病致病菌进行分析。【结论】 相关的分析结果能够指导食源性疾病的管理、处置方案的制定,基于分析结果和机器学习方法的致病菌识别能为食源性疾病的临床辅助诊疗提供有益支持。