摘要目的 利用决策树模型挖掘常见的临床检验资料信息,建立慢性乙型肝炎及肝硬化的无创诊断模型.方法 选择广州医科大学附属第二医院2015年HBV感染相关性疾病518例,其中慢性乙型肝炎组344例,肝硬化组174例,收集患者的基本信息及常见的21项临床检验指标.通过无放回分层抽样方法在这两组样本中分别抽取3/4共同构成388例的训练样本,分别抽取1/4共同构成130例的测试样本,利用决策树分类回归树(Classificationand Regression Trees,CART)和C4.5(Successor of ID3)两种算法构建模型,采用预测正确率和ROC曲线下面积(AreaUnder Curve,AUC)评价决策树模型的预测准确性.结果 决策树的根节点样本数均为388,即全部训练样本,分枝包含最小样本数为15,决策树挖掘深度为5.最后进入C4.5模型的仅有白蛋白这一变量,叶节点个数为2;进入CART模型的有9个变量,分别是年龄、白蛋白、白蛋白/球蛋白、甲胎蛋白、Ⅲ型前胶原氨端肽、间接胆红素、总蛋白、丙氨酸氨基转移酶、球蛋白,叶节点个数为11.CART模型的预测正确率为86.15%,高于C4.5模型的83.85%;两者的AUC分别为0.851 (95% CI:0.772 ~0.931)和0.822(95% CI:0.739 ~0.906).结论 利用决策树模型充分挖掘常规临床检验资料,所构建的无创诊断模型有较高的预测准确度,且CART模型优于C4.5模型,结果直观明了,解读性强,有一定的临床参考价值.
更多相关知识
- 浏览195
- 被引10
- 下载42

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文