QingNangTCM:一种面向中医领域的参数高效微调大语言模型
QingNangTCM:a parameter-efficient fine-tuning large language model for traditional Chinese medicine
摘要目的 针对通用大语言模型在中医专业问答与临床推理中存在领域知识、专业对齐程度有限等问题,构建一种面向中医应用场景的专用大语言模型 QingNangTCM.方法 构建了一个包含 10 万条样本的中医领域语料库QnTCM_Dataset,该语料库在整合 ShenNong_TCM_Dataset和 SymMap v2.0的基础上,引入检索增强生成与角色驱动生成策略进行数据扩展,覆盖中医诊断问答、处方建议及中药知识等核心任务.以GLM-4-9B-Chat为基座模型,采用 P-Tuning v2方法进行参数高效微调,得到 QingNangTCM模型.本研究建立了多维评测体系,从准确性、覆盖性、一致性、安全性、专业性与流畅性等方面进行综合评估,采用双语评估替补(BLEU)、面向召回的摘要评估研究(ROUGE)、机器翻译评估的度量(METEOR)等自动指标,并结合基于专家校验的 LLM-as-a-Judge评测方法.同时设计症状分析、疾病诊疗、中药查询和失败案例四类模拟临床场景开展定性分析,并与 GLM-4-9B-Chat、DeepSeek-V2、HuatuoGPT-II(7B)及GLM-4-9B-Chat(freeze-tuning)模型进行对比.结果 QingNangTCM在 BLEU-1/2/3/4(0.425/0.298/0.137/0.064)、ROUGE-1/2(0.368/0.157)及 METEOR(0.218)指标上均取得最优表现,在准确性、覆盖性与一致性维度上的归一化综合性能达到 0.900.尽管其 ROUGE-L 指标(0.299)略低于 HuatuoGPT-II(7B)(0.351),但在专家验证的专业性与安全性胜率评估中分别达到 86%和 73%.定性分析显示,该模型能够较好遵循"症状?证候?病机?治法"的中医诊疗推理链条,但在处理罕见中药及复杂证候组合时仍存在一定误判与幻觉现象.结论 通过将中医领域语料构建与参数高效的提示微调方法相结合,可增强大语言模型在中医相关任务中的推理与领域适配能力.相关工作为中医知识的数字化与智能化提供了一种技术框架,对辅助中医诊疗与教育具有一定的应用价值.
更多相关知识
- 浏览1
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



