肿瘤特征基因选择的互信息最值过滤原则与粒子群优化算法
Mutual information maximum value filter criteria combined with particle swarm optimization algorithm in feature gene selection for tumor classification
摘要基因数据小样本、高维数、高冗余的特点常导致特征基因选择出现“维数灾难”和“过拟合”,针对这一问题,提出一种特征基因提取算法——互信息最值过滤原则-惯性权重粒子群优化(MIMVFC-IWPSO)算法.首先,借鉴过滤法的思路,通过计算互信息指标,依据互信息最值过滤原则(MIMVFC)获得特征基因候选子集(FGCS),缩小分类操作的范围,提高特征基因被覆盖的概率;接着,对粒子群优化(PSO)算法进行改进,引入惯性权重实现自调节可变惯性权重粒子群优化(IWPSO)算法,使得在算法迭代初期有着快速的全局优化能力,而在算法后期具有较强的局部搜索能力;最后,运用IWPSO从FGCS中提取核心信息基因子集(CFGS),并基于CFGS对样本进行肿瘤与正常组织的分类.采用3个公开的肿瘤基因表达谱数据进行实验,MIMVFC正确分类率优于信噪比(SNR)、t-检验和信息增益(IG)方法,与卡方统计值(Chi-Square)方法接近,而MIMVFC还能利用IWPSO进一步优化结果.基于相同的FGCS,与目前效果较好的二进制粒子群优化与防治基因算法(BPSO-CGA)相比,IWPSO的运算耗时有所增加,但所获得的CFGS规模减小,准确率提高;而与经典PSO相比,所获得的CFGS规模减小、运算耗时减少、准确率提高.实验结果表明MIMVFC-IWPSO具有较好的综合分类性能,能有效提高准确率和效率,可用于多种肿瘤的特征基因选择,辅助指导分子生物学实验设计和验证.
更多相关知识
- 浏览0
- 被引10
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文