基于随机森林模型的前列腺特异性抗原灰区前列腺癌诊断研究
Development and Validation of a Random Forest-Based Model for Diagnosing Prostate Cancer in the Prostate-Specific Antigen Gray Zone
摘要[目的]应用随机森林(Random Forest,RF)算法,为前列腺特异性抗原(prostate-specific antigen,PSA)水平处于4~10 ng/mL(PSA灰区)的人群构建前列腺癌诊断模型,以提升前列腺癌诊断准确性并减少不必要的穿刺活检.[方法]回顾性收集520例患者的临床数据,按3∶1划分为训练集和测试集.通过网格搜索结合5折交叉验证优化超参数,并利用受试者工作特征(receiver operating characteristic,ROC)曲线、精确率-召回率(precision-recall,PR)曲线及准确率评价模型性能,同时进行变量重要性分析.[结果]PSA灰区患者中前列腺癌检出率为36.3%(189/520).最优超参数组合为:每次分裂随机选择2个变量、50棵决策树及节点最小样本数20.在此条件下,模型平均表现为ROC曲线下面积为0.819,PR曲线下面积为0.860,准确率为0.769.RF模型在训练集和测试集上的ROC曲线下面积分别为0.93和0.80,袋外误差率为24.94%.变量重要性分析显示,前列腺体积和PSA密度(PSA density,PSAD)是最主要的影响因素.[结论]RF模型在PSA灰区患者中具备较高的分类性能和临床应用价值,其中前列腺体积和PSAD是关键诊断指标,可为前列腺癌的临床决策提供有力参考.
更多相关知识
- 浏览0
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



