海佳丽, 汪润, 袁良志, 张凯睿, 邓文萍, 肖勇, 周涛, 常凯
预出版日期: 2025-02-11
[目的]构建基于检索增强的中医药标准知识问答系统,将高质量的中医药标准化知识和实践经验精准有效地传递给中医药行业从业者和普通民众,提升中医药标准化研究和应用水平。[方法]通过对比已有的大语言模型(如BaiChuan、Gemma、通义千问等)的性能表现,选择GPT 3.5模型作为基础模型,结合数据优化和检索增强生成等技术手段,开发出具有语义分析、上下文关联和生成能力的中医药标准知识问答系统。[结果]基于检索增强的中医药标准知识问答系统的答案相关性在中医文献问题生成数据集上的精确率、召回率和F1值分别为87.9%、83.9%、85.7%,在中医药标准问答数据集上的精确率、召回率和F1值分别为87.1%、83.6%、85.3%,上下文相关性在中医文献问题生成数据集上的精确率、召回率和F1值分别为83.8%、86.9%、85.3%,各项指标优于对比模型,表明本系统相较于其他模型能更好回答中医药标准相关的问题,具有较高的准确性。[局限]当前系统的意图识别模块仍需进一步优化,中医药标准知识库规模有待进一步扩充和更细粒度完善。[结论]本研究针对中医药知识服务的现实需求,探讨构建了基于检索增强的中医药标准知识问答系统,该系统能够回答用户关于中医药诊疗指南、中药标准、信息标准等各类问题,包括治疗原则、病证分类、治疗方法、中医药标准内容技术要求等,展示了较高的实用性和可行性。