医学文献 >>
  • 检索发现
  • 增强检索
知识库 >>
  • 临床诊疗知识库
  • 中医药知识库
评价分析 >>
  • 机构
  • 作者
默认
×
热搜词:
换一批
论文 期刊
取消
高级检索

检索历史 清除

大模型与小模型在胃癌筛查真实世界中的性能对比

Performance comparison of large and small models in real-world gastric cancer screening:an in-depth analysis of false positives and gray-zone cases

摘要目的 拟对比同一医院胃癌AI小模型与大模型在真实病理诊断世界中的性能漂移,并评估大模型对小模型的假阳性及灰区病例的修正价值.方法 收集中日友好医院2023年9月1日至11月30日(小模型,n=1 455)及2025年4月1日至6月30日(大模型,n=8 296)的胃镜活检及ESD切片,以最终病理诊断报告作为金标准.模型切片级预测概率<0.8为阴性,0.8~0.94为灰区,≥0.94为阳性;评价指标包括准确率、敏感性、特异性、PPV、NPV、灰区占比和恶性富集度.另从小模型结果中随机抽取37例(假阳性4例、灰区33例)回代大模型进行配对验证,并用McNemar检验比较差异.结果 (1)将灰区并入阳性:大模型准确率、特异性、PPV分别为99.87%、99.87%、87.91%,较小模型分别提升3.86%、3.91%、61.33%(均P<0.001);敏感性、NPV均为100%,两组无差异.(2)剔除灰区:大模型准确率99.96%、特异性99.96%、PPV 95.71%,仍优于小模型(P<0.05).(3)灰区占比:大模型0.25%,较小模型3.85%(P<0.001);灰区恶性比例由8.9%升至61.9%(P<0.001).(4)交叉验证:大模型将4例假阳性全部纠正,32/33例灰区重分类为阴性,整体修正率97.3%,无新增假阳性或漏诊(P<0.001).而小模型将大模型预测的假阳性3例、灰区3例均预测为阳性,且假阳性区明显大于大模型.结论 4亿参数大模型在保持100%敏感性的同时,显著降低假阳性及灰区占比,并实现对真正可疑病灶的高效富集,优于器官专属小模型,可推广至胃部早癌规模化筛查.

更多
广告
栏目名称
DOI 10.3969/j.issn.1007-8096.2026.02.001
发布时间 2026-04-10(万方平台首次上网日期,不代表论文的发表时间)
基金项目
  • 浏览1
  • 下载0
诊断病理学杂志

加载中!

相似文献

  • 中文期刊
  • 外文期刊
  • 学位论文
  • 会议论文

加载中!

加载中!

加载中!

加载中!

法律状态公告日 法律状态 法律状态信息

特别提示:本网站仅提供医学学术资源服务,不销售任何药品和器械,有关药品和器械的销售信息,请查阅其他网站。

  • 客服热线:4000-115-888 转3 (周一至周五:8:00至17:00)

  • |
  • 客服邮箱:yiyao@wanfangdata.com.cn

  • 违法和不良信息举报电话:4000-115-888,举报邮箱:problem@wanfangdata.com.cn,举报专区

官方微信
万方医学小程序
new医文AI 翻译 充值 订阅 收藏 移动端

官方微信

万方医学小程序

使用
帮助
Alternate Text
调查问卷