摘要目的:<br> 骨肉瘤作为青少年和儿童群体最常见的原发性恶性骨肿瘤,其耐药及高转移率一直是治疗难题。随着近年高通量技术的飞速发展,通过大量RNA转录组测序数据和临床随访数据结合基础实验验证的方式,可探索可靠的肿瘤生物标志物。本实验意在通过机器学习筛选骨肉瘤生物标志物及探索关键基因NDUFB9对骨肉瘤细胞恶性生物学行为如增殖、迁移、侵袭的影响,并进一步探究其作用机制。<br> 方法:<br> (1)基于GEO数据库获取mRNA表达谱数据集GSE19276和GSE36001,合并后进行综合分析,筛选出差异基因。<br> (2)对差异基因进行GO和KEGG途径富集分析,分析其重要功能和生物学途径。<br> (3)对合并后的数据集进行Lasso回归分析和SVM-RFE分析,取两者交集作为骨肉瘤生物标记物,绘制相关生物标记物ROC曲线评估这些基因在诊断疾病时的准确性,并对特征基因表达与肉瘤中不同免疫浸润水平的相关性进行可视化。<br> (4)通过qRT-PCR和Westernblot检测关键基因NDUFB9在骨肉瘤四种细胞系中mRNA和蛋白水平的表达。<br> (5)通过si-RNA和过表达质粒分别敲低和提高NDUFB9的表达,并使用qRT-PCR和Westernblot验证转染效率。随后进行CCK-8实验、EdU实验和平板克隆实验检测骨肉瘤细胞的增殖活性,进行Transwell实验和划痕实验检测骨肉瘤细胞迁移及侵袭能力。<br> (6)Westernblot检测敲低NDUFB9后EMT通路关键蛋白的变化。<br> 结果:<br> (1)以|log2FC|gt;1、Plt;0.05为筛选标准,在骨肉瘤组和正常组之间总共鉴定出99个差异基因,其中30个基因显著上调,69个基因显著下调。<br> (2)GO富集结果显示差异基因涉及参与免疫反应的中性粒细胞激活、中性粒细胞脱颗粒等生物过程;涉及的主要细胞成分包括分泌颗粒管腔、细胞质囊泡腔体等;涉及的主要分子功能包括肝素结合,免疫球蛋白结合等。KEGG富集分析显示差异基因主要参与中性粒细胞外捕集器的形成、成骨细胞的分化等。<br> (3)Lasso回归分析筛选出9个特征基因,SVM-RFE分析筛选出42个特征基因,综合两种机器学习算法最终筛选出NFE2,RHPN2,MFNG,NARS,NDUFB9,HMGB2和S100A10这7个基因可作为骨肉瘤的生物标志物。并通过ROC曲线分析,发现除了HMGB2对筛选骨肉瘤样本的能力较差,剩余6个基因在诊断疾病时均具有较好的准确性。且这些基因的表达与不同免疫细胞浸润呈现出不同相关性。<br> (4)相对于hFOB1.19细胞,骨肉瘤四种细胞系中NDUFB9的mRNA和蛋白表达水平均增高。<br> (5)体外敲低NDUFB9后减弱了骨肉瘤细胞的增殖、迁移和侵袭能力,而过表达NDUFB9则呈现出相反的作用。<br> (6)敲低NDUFB9后EMT通路关键蛋白E-cadherin的蛋白水平上升,而N-cadherin和Vimentin的蛋白水平下降,从而影响骨肉瘤细胞的迁移及侵袭能力。<br> 结论:<br> 我们通过对骨肉瘤基因表达芯片的分析,利用机器学习算法找出骨肉瘤生物标记物,包括NFE2,RHPN2,MFNG,NARS,NDUFB9,HMGB2和S100A10,体外实验证明NDUFB9在骨肉瘤中高表达并影响骨肉瘤细胞的恶性表型,且通过EMT通路部分调控其迁移及侵袭能力,为骨肉瘤的早期诊断和治疗提供参考。
更多相关知识
- 浏览1
- 被引0
- 下载1
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文