摘要甲状腺是人体内最大的内分泌腺,对人体的健康至关重要。近年来,甲状腺疾病的发病率在全球范围内呈逐年增长趋势,产生了大量的甲状腺疾病临床数据。甲状腺临床数据是医学研究重要的数据来源,通过对临床数据样本进行训练,发现样本内在关联,可以达到辅助预测诊疗的目的。<br> 现有的关于甲状腺疾病的辅助诊疗研究主要是通过机器学习的方式来实现。研究主要集中在甲状腺疾病分类、结节发现及良恶性预测上。机器学习和深度学习方法使用扁平式的训练集,但患者临床数据可视为高维度模型,包括多个维度的健康状况信息如年龄、职业、病史、用药记录、免疫情况(如白细胞计数血检指标)等,并且疾病的发生往往也是多种因素综合作用的结果,扁平式的数据不足以满足训练要求。<br> 为解决上述问题,本文选择张量模型进行研究。张量是一个高维模型,可以存储对疾病发生和发展产生影响的多维度信息,进而做出较为准确的预测。但是张量模型维度一般比较高,信息量大,在训练中极为不灵活。针对这一问题,本文提出了全新的基于张量分解的甲状腺疾病辅助诊疗模型。该模型通过对张量进行特征选择,同时按任务拆分亚张量的方法,改善高维数据不灵活的缺点,并且实现了同一个模型、同一批原始数据执行多种训练预测任务。再利用张量固有的高维优势结合主动学习方法完成多重训练和迭代,实现对数据的高效利用。在实验中,除了实验设计上的适应性调整,模型还对主动学习的询问机制做了改进,提出了基于差异度-信息量的方法。模型通过各种方式提高了数据利用率,挖掘出高维度的隐含信息。本文的研究内容如下:<br> 首先,本文对甲状腺疾病辅助诊疗的方法和张量模型的应用方法进行了技术整理,针对现有甲状腺疾病辅助诊断方法训练数据扁平化的缺点,选择了张量模型作为研究基础。以基于张量分解的甲状腺疾病辅助诊断模型为核心,设计实现了甲状腺疾病辅助诊疗系统。为简化张量前期处理,本文提出了原始张量池的概念,并详细阐述构建原始张量池的过程。<br> 其次,本文详细阐述了基于张量分解的甲状腺疾病辅助诊疗模型。为了保证预测效果,本课题提出了按照预测任务进行特征选择构建亚张量的方法,同时实现了多任务预测。本课题用张量分解的方式训练模型,并且针对张量分解过程难以干预的缺陷,提出了融合主动学习思想的方式增加迭代过程,优选样本。本模型用张量挖掘各维之间的隐含联系,并用特征选择和主动学习方法优选质量高影响大的样本以提高预测的准确度。实验结果表明,模型具有优良的泛化能力。<br> 最后,基于上述模型,本课题实现了甲状腺疾病辅助诊疗系统,用以进行甲状腺疾病的各种辅助诊断,包括疾病预测分类、检查指标推荐和预测、用药推荐、结节良恶性预测等,实现对甲状腺疾病高效全面的辅助诊疗。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文