医学文献 >>
  • 检索发现
  • 增强检索
知识库 >>
  • 临床诊疗知识库
  • 中医药知识库
评价分析 >>
  • 机构
  • 作者
默认
×
热搜词:
换一批
论文 期刊
取消
高级检索

检索历史 清除

大语言模型在分析性研究偏倚风险评估中的准确性评价

Evaluation of the accuracy of the large language model for risk of bias assessment in analytical studies

摘要目的 评价大语言模型(LLM)评估分析性研究偏倚风险的准确性和一致性.方法 基于团队已发表的系统评价中纳入的队列和病例-对照研究文献,分别由研究人员和基于LLM的BiasBee模型(version Non-RCT)评价偏倚风险,采用Kappa统计量和评分差异分析LLM与研究人员的评分一致性,并针对中、英文文献进行亚组分析.结果 共纳入210篇文献.评分差异分析结果显示LLM对大多数指标的评分高于研究人员,暴露队列代表性(△=0.764)和外部对照选择(△=0.109)尤为明显.Kappa分析结果显示LLM和研究人员对暴露测定(κ=0.059)和随访充分性(κ=0.093)的评价结果表现出轻微一致性,而在对照选择(κ=-0.112)和无应答率(κ=-0.115)等主观性较强的指标差异显著.亚组分析显示,LLM对英文文献的评分一致性高于中文文献.结论 LLM具有评估文献偏倚风险的应用潜力,但对主观性较强的评价指标与人工评价结果存在明显差异.因此在未进行针对特定任务的培训的前提下,LLM尚无法取代人工评估分析性研究偏倚风险.

更多
广告
栏目名称
DOI 10.7507/1672-2531.202411028
发布时间 2025-06-19(万方平台首次上网日期,不代表论文的发表时间)
基金项目
  • 浏览8
  • 下载0
中国循证医学杂志

中国循证医学杂志

2025年25卷5期

562-567页

ISTICPKUCSCD

加载中!

相似文献

  • 中文期刊
  • 外文期刊
  • 学位论文
  • 会议论文

加载中!

加载中!

加载中!

加载中!

特别提示:本网站仅提供医学学术资源服务,不销售任何药品和器械,有关药品和器械的销售信息,请查阅其他网站。

  • 客服热线:4000-115-888 转3 (周一至周五:8:00至17:00)

  • |
  • 客服邮箱:yiyao@wanfangdata.com.cn

  • 违法和不良信息举报电话:4000-115-888,举报邮箱:problem@wanfangdata.com.cn,举报专区

官方微信
万方医学小程序
new医文AI 翻译 充值 订阅 收藏 移动端

官方微信

万方医学小程序

使用
帮助
Alternate Text
调查问卷