摘要目的 基因芯片技术对医学临床诊断、治疗、药物开发和筛选等技术的发展具有革命性的影响.针对高维医学数据降维困难及基因表达谱样本数据少、维度高、噪声大的特点,维数约减十分必要.基于主成分分析(principal component analysis,PCA)和线性判别分析(linear discriminant analysis,LDA)方法,有效解决了基因表达谱数据分类问题,并提高了识别率.方法 分别引入PCA和LDA方法对基因表达谱数据进行降维,然后用K近邻(K-nearest neighbor,KNN)作为分类器对数据进行分类,并分别在乳腺癌和卵巢癌质谱数据上.结果 在两类癌症质谱数据上应用PCA和LDA方法能够有效提取分类特征信息,并在保持较高分类正确率的前提下大幅度降低医学数据的维数.结论 利用维数约减的方法对癌症基因表达谱数据进行分类,可辅助临床医生发现新的疾病特征,提高疾病诊断的正确率.
更多相关知识
- 浏览352
- 被引16
- 下载9

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



