首页 > 数字中医药（英文版） > QingNangTCM:一种面向中医领域的参数高效微调大语言模型

QingNangTCM:一种面向中医领域的参数高效微调大语言模型

QingNangTCM:a parameter-efficient fine-tuning large language model for traditional Chinese medicine

二维码有效期 120s

摘要目的针对通用大语言模型在中医专业问答与临床推理中存在领域知识、专业对齐程度有限等问题,构建一种面向中医应用场景的专用大语言模型 QingNangTCM.方法构建了一个包含 10 万条样本的中医领域语料库QnTCM_Dataset,该语料库在整合 ShenNong_TCM_Dataset和 SymMap v2.0的基础上,引入检索增强生成与角色驱动生成策略进行数据扩展,覆盖中医诊断问答、处方建议及中药知识等核心任务.以GLM-4-9B-Chat为基座模型,采用 P-Tuning v2方法进行参数高效微调,得到 QingNangTCM模型.本研究建立了多维评测体系,从准确性、覆盖性、一致性、安全性、专业性与流畅性等方面进行综合评估,采用双语评估替补(BLEU)、面向召回的摘要评估研究(ROUGE)、机器翻译评估的度量(METEOR)等自动指标,并结合基于专家校验的 LLM-as-a-Judge评测方法.同时设计症状分析、疾病诊疗、中药查询和失败案例四类模拟临床场景开展定性分析,并与 GLM-4-9B-Chat、DeepSeek-V2、HuatuoGPT-II(7B)及GLM-4-9B-Chat(freeze-tuning)模型进行对比.结果 QingNangTCM在 BLEU-1/2/3/4(0.425/0.298/0.137/0.064)、ROUGE-1/2(0.368/0.157)及 METEOR(0.218)指标上均取得最优表现,在准确性、覆盖性与一致性维度上的归一化综合性能达到 0.900.尽管其 ROUGE-L 指标(0.299)略低于 HuatuoGPT-II(7B)(0.351),但在专家验证的专业性与安全性胜率评估中分别达到 86%和 73%.定性分析显示,该模型能够较好遵循"症状?证候?病机?治法"的中医诊疗推理链条,但在处理罕见中药及复杂证候组合时仍存在一定误判与幻觉现象.结论通过将中医领域语料构建与参数高效的提示微调方法相结合,可增强大语言模型在中医相关任务中的推理与领域适配能力.相关工作为中医知识的数字化与智能化提供了一种技术框架,对辅助中医诊疗与教育具有一定的应用价值.