首页 > 广东医学 > 超轻量级DeepSeek-R1大语言模型在CT报告分类中的微调性能研究

超轻量级DeepSeek-R1大语言模型在CT报告分类中的微调性能研究

Fine-tuning performance of an ultra-lightweight DeepSeek-R1 large language model for CT report classifica-tion

二维码有效期 120s

摘要目的针对临床CT报告分诊中对严重性精准分类的需求,通过微调超轻量级大语言模型DeepSeek-R1-1.5B,并系统评估其性能.方法回顾性收集6 000份CT报告(5 000份用于训练/验证/内部测试,外部1 000份用于独立测试),由放射科专家依据临床意义标注为"阴性"、"常规"(常见疾病)和"紧急"(严重疾病)三类.对 DeepSeek-R1-1.5B、Bert-base-uncased、Qwen2.5-1.5B 及 Llama3.2-1B 四种轻量级模型进行训练,并引入未微调的全量级模型DeepSeek-R1-671B作为零样本对照.结果微调后DeepSeek-R1-1.5B表现最优,内部与外部测试集准确率分别达0.964(95％CI:0.962-0.966)和0.962(0.960-0.963),显著优于其他三种微调后的轻量级模型(P＜0.001)及未微调的DeepSeek-R1-671B(P＜0.001).亚组分析显示,该模型在不同扫描类型与解剖部位下均保持稳定高性能.结论经领域适配的超轻量级模型DeepSeek-R1-1.5B在CT报告三分类严重性判别任务中展现出高准确率,凸显其在资源受限环境中临床部署的潜力.