摘要近年来智慧医疗飞速发展,利用人工智能技术辅助医疗诊断已经成为趋势,国内外对机器学习辅助医疗的研究的也越发成熟,许多关于疾病的机器学习预诊模型都已建立。采用机器学习算法来辅助医生进行诊断,将会很大程度上提高诊断的科学性,也能有效地克服仅凭医生经验来诊断的主观性问题,还从一定程度上减轻了医生的负担。针对以上研究背景,本文依托于实验室研究项目,对肌少症这一疾病进行研究,建立一个适用于肌少症诊断的机器学习模型。本文在第二、第三章中对相关的理论基础进行的详细的阐述,主要包括数据的处理、模型的评价以及算法介绍几个方面。对机器学习算法的选择上,本文采用支持向量机(SVM)、随机森林(RF)、XGBoost和CatBoost四种算法进行对比研究,对于模型的评价指标,本文选择了准确率、精确率、召回率和F1值四个指标。<br> 值得一提的是,本文中的肌少症数据除了包含一些门诊数据之外,也包含了一些行为数据,在第四章中从特征的相关性研究和机器学习算法给出的重要程度排序两方面论证了这些行为特征对预诊模型建立的重要性,从医学诊疗上看也丰富了患者的数据类型。<br> 本文在研究的过程中还强调了分类问题中类别均衡对算法训练的重要性,并采用SMOTE算法对样本做了类别均衡处理,将均衡化处理前后的模型表现进行对比,发现处理后模型的各项评价指标均有显著提高,具体提高的百分比在文章第五章中的表10中给出,其中CatBoost算法在四个评价指标上分别提高了2.76%,36.36%,82.50%.66.21%。<br> 最后将四种算法运用在肌少症数据集上,通过各个算法效果的横向和纵向对比,通过观察模型评价的四个指标:准确率、精确率、召回率和F1值,得出了CatBoost算法表现较佳的结论,并结合数据特征建议在样本量少特征较多的肌少症数据集上,采用CatBoost机器学习算法进行疾病预诊。<br> 除此之外,文章还对算法在各类数据集上的表现进行了对比研究,发现了CatBoost算法的稳定性,并结合不同算法的运行时间,给出了研究其他问题时算法选择上的相关建议。
更多相关知识
- 浏览0
- 被引2
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



