摘要肿瘤可分为良性和恶性肿瘤两大类,恶性上皮细胞肿瘤也叫癌症,它是目前最严重的危害人类健康的一类疾病。一般来说,如果能在早期将癌症扼杀,不但治愈机会大,而且能大大减少癌症患者的费用支出和身心痛苦。因此,及时、准确地诊断将对肿瘤的后期治疗意义至关重大。但是,由许多因素引起的同一种癌症可能有不同的症状,传统的诊断方法可能无法准确地确诊癌症类型,而基因芯片技术的发展使得利用基因表达数据的肿瘤分类能够获取更准确的结果。基因表达数据具有类分布不平衡、高维小样本和高噪声特点,如何对此类数据进行有效的分析和处理引起了学者们的广泛关注。由于极限学习机具有学习速度快、简单易实现、泛化能力强等特点,本文针对基因表达数据的特点进行极限学习机分类研究,并将研究成果应用于肿瘤分类诊断,以促进肿瘤的预测和预防工作,提高人类健康水平。<br> 本文研究的关键性内容以及成果如下:<br> (1)提出了基于改进的人工蜂群优化策略的极限学习机分类模型。针对极限学习机分类性能受输入权值及隐层阈值影响的问题,提出了改进的新颖人工蜂群算法,实现了极限学习机输入权值及隐层阈值的迭代优化,保证了分类精度最大化以及输出权值范数最小化。通过在肿瘤诊断以及目标识别、图像分割数据集上的对比实验证明了该模型能够得到紧凑的网络结构,又能提高极限学习机模型的泛化能力。<br> (2)提出了基于集成的模糊加权极限学习机分类模型。利用信息增益的方法对原始数据进行特征选择,降低训练复杂度。构建了模糊加权极限学习机分类模型,即提出了平衡因子弥补由不平衡数据造成的分类偏差,利用模糊隶属度抑制噪声和离群点对分类的影响。另外,提出了选择性集成新策略,即基于差异性度量准则剔除部分基分类器,通过多数投票的方法利用剩余的基分类器做出最终决策,使分类性能更加稳定、更加准确。最后,在肿瘤基因表达数据以及KEEL数据集上进行了大量对比实验,实验结果证明,该模型能够抑制噪声和离群点的影响,能有效地处理多类不平衡数据。<br> (3)提出了基于自适应加权核极限学习机分类模型。构建了加权核极限学习机分类模型,即提出了加权策略弥补分类器的偏斜,同时利用核函数处理在高维特征空间中存在的“维数灾难”计算问题,以降低计算复杂度。在此基础上,提出了自适应人工蜂群算法同步完成特征选择与参数优化,以增强加权核极限学习机的分类性能,一方面提出了离散型自适应人工蜂群算法鉴别最具分辨力的特征,另一方面提出了连续型自适应人工蜂群算法优化加权核极限学习机的参数实现分类。最后,在帕金森病数据集以及肿瘤基因表达数据上进行了大量对比实验,实验结果证明,该模型能够找出合理的数量较少的特征子集,并具有快速的分类效率和高的分类精度。<br> (4)提出了增强的基于核的多层模糊加权极限学习机分类模型。提出了基于核的模糊加权极限学习机模型,即在核极限学习机中引入加权策略和模糊隶属度,再以基于核的模糊加权极限学习机的自动编码器作为基本组件构建了深度学习网络模型,实现了特征的深度提取。在此基础上,提出了增强的灰狼优化算法实现深度学习网络模型的参数优化,提高深度学习网络模型的泛化能力。另外,该模型将特征学习和分类过程集成一体,即堆叠多个基于核的模糊加权极限学习机的自动编码器实现特征学习,利用最后一层基于核的模糊加权极限学习机实现分类。最后,在肿瘤基因表达数据以及KEEL数据集上进行了大量对比实验,实验结果证明,该模型具有良好的稳定性,能高效地处理不平衡和高维数据。
更多相关知识
- 浏览0
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



