利用可解释机器学习方法揭示大脑结构相关遗传位点
Interpretable Machine Learning Reveals Genetic Loci Underlying Brain Structure
摘要目的 基于遗传变量和人口统计学因素构建机器学习(ML)模型预测大脑灰质体积(GMV)和白质体积(WMV),并利用可解释方法识别关键预测特征及大脑结构新颖遗传位点.方法 基于英国生物样本库(UK Bio-bank)3万余被试的脑影像衍生表型、基因型与人口统计学数据,采用XGBoost/LightGBM等6种ML模型以探究大脑结构的测量值与遗传变量和人口统计学因素之间的关联.利用SHAP(SHapley additive exPlanations)可解释性框架识别关键遗传位点,并对其进行基因注释.结果 模型性能评估结果表明,LightGBM和CatBoost模型分别在GMV和WMV预测表现中最优,相关系数分别达到0.6874与0.4101.SHAP分析不仅复现了多个已知脑结构相关遗传位点,也识别出若干传统全基因组关联分析中未报道的新候选位点.例如,GMV相关位点rs187620717位于GMNC基因附近,其所在区域已被报道与脑脊液p-tau水平相关;WMV相关位点rs11196180邻近TCF7L2基因,其与杏仁核体积较小和精神分裂症相关.进一步分析揭示年龄与基因(如FAM3C、PPM1K)在脑结构调控中具有交互作用.结论 对于脑影像表型利用ML模型结合可解释性技术可成功识别出与脑结构相关的新颖相关位点,并捕捉遗传位点间及其与人口学因素间的复杂交互作用,为解析脑疾病机制提供了新线索.
更多相关知识
- 浏览1
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



