摘要甲状腺是人体最大的内分泌腺体,甲状腺结节则是甲状腺内部的肿块,可分为良性和恶性两类。我国的甲状腺结节发病率高居全球前列,属于高发性疾病,患者基数大。超声检查由于其高效且无创的特点成为了筛查诊断甲状腺结节的主要手段。甲状腺超声报告通常描述了甲状腺腺体、局灶性病变和淋巴结的形态及血流特征,这些特征是临床医生进行结节良恶性诊断的主要依据。因此,利用人工智能技术对甲状腺超声特征进行深度学习,建立甲状腺结节AI诊断模型,辅助临床医生进行甲状腺结节良恶性的诊断,有助于缓解医护资源不足的现状。<br> 目前,已有不少学者投入到如何将人工智能技术应用于甲状腺结节诊断的研究中,并且已经取得不错的成果。然而,大多数AI诊断模型只处于研究阶段,无法在医院内普及应用,主要原因为:医学诊断的容错性低,且深度学习模型是不可解释的,人们无法信任一个不能提供解释的黑盒模型的判断。因此,同时具备诊断能力和解释能力,是推广使用AI诊断模型的必要条件。<br> 针对甲状腺结节高发性及现阶段诊断模型缺乏可解释性的问题,本文研究并实现了甲状腺结节可解释AI诊断系统,该系统主要分为两个模块,分别为基于结构化超声特征的甲状腺结节诊断模型的训练模块和甲状腺结节诊断模型的局部后解释模块。前者训练的模型用于实现超声报告的预测,得到诊断结果;后者用于分析预测模型在实例范围内的行为,得到解释结果。本文的主要研究内容包括如下三个方面:<br> 1)阐述了甲状腺结节可解释AI诊断系统的总体框架,分析了系统模块组成及各模块作用。在此基础上说明了甲状腺结节可解释AI诊断系统需要由甲状腺结节诊断模型训练模块和局部后解释模块组成的必要性,并具体描述了每个模块的流程。<br> 2)构建了基于结构化超声特征的甲状腺结节诊断模型。首先分析了甲状腺超声文本报告的特点,接着利用甲状腺语义树驱动的结构化扫描方法将文本报告转换为结构化数据。再利用患者在适当时间范围内的病理检查结果提取对应超声报告的标签,完成超声特征数据集准备。在此基础上,训练基于DeepFM的甲状腺结节良恶性预测模型。最后,在实验部分展示了结构化结果以及证明了基于结构化超声特征的甲状腺结节诊断模型的有效性。<br> 3)具体阐述了甲状腺结节诊断模型的局部后解释方法,该方法改进了主流模型后解释方法LIME的解释不稳定的弊端,具体从三个点进行改进。一是针对生成扰动数据集时,LIME对每维特征独立采样导致生成样本偏离实际数据分布,提出了构建贝叶斯网络并基于贝叶斯网络进行相关性采样,得到考虑特征之间相关性的生成样本再进一步获取扰动数据集;二是针对数据维度较高时,LIME无法区分扰动样本与待解释实例距离远点和近点的缺陷,提出了先对数据进行基于自编码器降维再计算权重的方式;三是针对局部拟合时,LIME采用的线性模型的拟合效果较差,提出了以回归决策树代替作为局部拟合模型,使其能够在得到清晰特征权重的同时提升局部拟合度。最后通过实验结果的分析,证明了改进后的局部后解释方法具有更高的稳定性,并在系统中对诊断和解释结果进行了展示。<br> 综上,本文通过对系统的框架设计和各模块流程、基于结构化超声特征的甲状腺结节诊断模型的构建、甲状腺结节诊断模型的局部后解释方法的阐述,研究并实现了甲状腺结节可解释AI诊断系统。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文