摘要基因微阵列技术能够跟踪监测不同组织中数以万计的基因表达水平,它不仅对癌症生物学研究起到有力的科学根据,而且对癌症组织的分类识别有很大帮助。DN A微阵列技术因为它的高效、高通量的特性,如今已被广泛应用于各种生物医学的探究中,这一技术能够大量的检测肿瘤的基因表达状况,并获取其基因表达谱,进而通过肿瘤基因表达谱对那些结构特点类似的肿瘤进行分类,以实现对恶性肿瘤的诊断和治疗。因此,基因微阵列技术以其巨大的发展潜力为肿瘤的精确诊断和分类提供有效手段,并对肿瘤的治疗具有重大意义。<br> 然而,由于被检测的基因多达数千乃至数万,而实验研究的成本又高就很容易致使样本数量少。高维数、高噪声和小样本等问题是肿瘤基因数据必然存在的,传统的基因研究方法并不能很好地减少这些问题带来的影响,不能快捷有效的从大量基因中选择出少量差异表达基因,因此,寻找简单有效的无关基因的剔除方法,减少冗余基因以降低数据维数,选取最优特征基因提高分类的准确率,是本文研究的重要课题。<br> 本文针对结肠癌基因表达谱数据特征基因选择问题,通过对数据预处理方法和数据降维方法进行研究,提出了将过滤和缠绕法相组合的一种混合的方法,对无关基因进行预剔除。接着,本文又将主成分(PCA)线性降维方法应用于剔除无关基因后的数据,进一步减少冗余基因对样本分类的影响。最后,将特征选择和支持向量机的分类分型与检验相结合,找出最优特征基因以提高分类的准确率。<br> 应用上述方法,本文对基因表达谱数据的特征基因提取和肿瘤样品的分类问题做了研究,从结肠癌的数据集里找到了具有代表性的特征基因,同时也获得了较好的分类分型成果。
更多相关知识
- 浏览0
- 被引2
- 下载4

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



