基于公共基因表达数据库和临床样本队列构建白内障预测模型
Model Construction for Cataract Prediction Based on Public Expression Database and Clinical Cohort
摘要基于基因表达数据库(Gene Expression Omnibus,GEO)筛选差异基因,建立白内障预测模型并对其进行评价.首先,采用生物信息学方法从GEO中筛选出与白内障相关的芯片数据,并采用GEO2R软件和Net-workAnalyst工具分析得到最显著的差异表达基因.然后,依托我院健康管理中心白内障筛查队列,采用Cox比例风险回归构建白内障发病风险预测模型,绘制列线图,通过C指数、校准曲线、受试者操作特征(receiver operating characteristic,ROC)曲线、决策曲线分析(decision curve analysis,DCA)评价模型的区分度、校准度、预测能力和获益情况.结果显示,在GSE5645、GSE193629和GSE161701数据集中,鱼精蛋白1(protamine 1,PRM1)为高表达基因,五羟色胺2C受体(serotonin 2C receptor,HTR2C)为低表达基因;白内障组和非白内障组在年龄、体重、收缩压、对比敏感度(contrast sensitivity,CS)、客观散射指数(objective scatter index,OSI)、调制传递函数截止频率(modulation transfer function cut off,MTF cut off)、斯特列尔比(Strehl ratio,SR)、动态视力、PRM1、HTR2C和CX46等指标的差异均有统计学意义(P<0.05);预测模型最终纳入年龄、OSI、MTF cut off、PRM1和HTR2C共 5 个变量(P<0.05),建立的预测模型为 log[h(t)/h0(t)]=2.689 2+0.012×年龄+1.320×OSI-0.041×MTF cut off+0.029×PRM1-6.549×HTR2C;模型C指数为0.875,置信区间为0.862~0.886;模型的预测概率与实际概率接近;ROC 曲线下面积(area under the curve,AUC)为 0.904(95%CI:0.884~0.923),灵敏度和特异度分别为 82.4%和92.3%;平均AUC为0.911;当模型的高风险阈值为0.25~0.75时,净收益率>0.本研究建立的白内障临床预测模型具有很好的区分度、校准度、预测能力、内部有效性和临床效益,具备较高的临床应用价值.
更多相关知识
- 浏览23
- 被引0
- 下载11

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文