首页 > 临床放射学杂志 > 利用可解释机器学习方法揭示大脑结构相关遗传位点

利用可解释机器学习方法揭示大脑结构相关遗传位点

Interpretable Machine Learning Reveals Genetic Loci Underlying Brain Structure

二维码有效期 120s

摘要目的基于遗传变量和人口统计学因素构建机器学习(ML)模型预测大脑灰质体积(GMV)和白质体积(WMV),并利用可解释方法识别关键预测特征及大脑结构新颖遗传位点.方法基于英国生物样本库(UK Bio-bank)3万余被试的脑影像衍生表型、基因型与人口统计学数据,采用XGBoost/LightGBM等6种ML模型以探究大脑结构的测量值与遗传变量和人口统计学因素之间的关联.利用SHAP(SHapley additive exPlanations)可解释性框架识别关键遗传位点,并对其进行基因注释.结果模型性能评估结果表明,LightGBM和CatBoost模型分别在GMV和WMV预测表现中最优,相关系数分别达到0.6874与0.4101.SHAP分析不仅复现了多个已知脑结构相关遗传位点,也识别出若干传统全基因组关联分析中未报道的新候选位点.例如,GMV相关位点rs187620717位于GMNC基因附近,其所在区域已被报道与脑脊液p-tau水平相关;WMV相关位点rs11196180邻近TCF7L2基因,其与杏仁核体积较小和精神分裂症相关.进一步分析揭示年龄与基因(如FAM3C、PPM1K)在脑结构调控中具有交互作用.结论对于脑影像表型利用ML模型结合可解释性技术可成功识别出与脑结构相关的新颖相关位点,并捕捉遗传位点间及其与人口学因素间的复杂交互作用,为解析脑疾病机制提供了新线索.