摘要目的:<br> 急性胰腺炎(acute pancreatitis,AP)是一种常见的消化系统疾病,指多种病因包括酒精中毒、高脂血症、暴饮暴食、药物等引起的胰酶激活,继以胰腺局部炎性反应为主要特征,伴或不伴有其他器官功能改变的急症。临床上大多数患者为轻度急性胰腺炎,不伴有器官衰竭和局部并发症。少数患者为重度急性胰腺炎,起病急且病情较重,常伴有器官衰竭和(或)局部并发症,以致住院天数长、预后差、死亡率高。因此,AP的分级和严重程度对于临床实践和研究十分重要。本研究旨在利用支持向量机基于电子病历构建重度急性胰腺炎预测模型,提出简单易行、新型的预测模型,进一步开发设计Windows应用程序,创建重度急性胰腺炎早期预警系统,辅助临床决策。<br> 方法:<br> 随机抽取辽宁省某医院去识别化的2013年1月至2015年3月主诊断为急性胰腺炎的电子病历。参考UpToDate临床顾问数据库中列出的AP严重程度危险因素,最终选取的研究变量(n=20)包括:年龄、白细胞计数、红细胞比积、尿素、肌酐、K+、Na+、Ca2+、血清淀粉酶、血清脂肪酶、体温、心率、呼吸频率、血压(收缩压/舒张压)、腹痛时间,以及是否神清、有无器官衰竭、有无胰腺坏死、有无胸腔积液。时间选取入院48小时内。本研究选用出院诊断重度急性胰腺炎与否作为结局变量。<br> 所纳入变量中4项以文字描述形式出现在首次病程记录,利用ICTCLAS软件初步分词处理各首次病程记录之病例特点,建立添加用户词典,再调用NLPIR函数抽取所调整疾病严重程度特征词。<br> 获得研究变量数据存在缺失值,剔除存在缺失值的样本。腹痛时间变量单位统一至天。将纳入样本按3∶1分为训练集和测试集。<br> MATLAB2010a环境下,基于支持向量机(support vector machine,SVM)LIBSVM3.11,采用优化后的径向基核函数产生的分类器,同时结合统计学单因素及多因素Logistic回归分析方法,进行特征变量选取,提出一种简单易行的重度急性胰腺炎早期预测模型。依据所选取特征变量,再次基于SVM构建重度急性胰腺炎早期预测模型,比较预测性能前后是否有所提高,确定最终预测模型决策函数表达式。通过组件对象模型(component object model,COM)建立动态链接库实现VB.NET与MATLAB的混合编程,调用预测模型决策函数设计开发重度急性胰腺炎早期预测应用程序。<br> 采用测试集数据客观评估应用程序预测性能,评估指标包括准确率(accuracy)、灵敏度(sensitivity)、特异度(specificity)、阳性预测值(positivepredictive value)和阴性预测值(negative predictive value)。<br> 结果:<br> 最终纳入323例,其中非重度急性胰腺炎203例、重度急性胰腺炎120例。纳入训练集242例,90例出院诊断为重度急性胰腺炎,所占比例为37.19%;测试集81例,30例出院诊断为重度急性胰腺炎,所占比例为37.04%。<br> 分别针对训练集和测试集数据,采用留一法进行交叉验证,线性、多项式、径向基、sigmoid核函数的预测准确率分别为69.83%、69.83%、59.09%、62.81%和67.90%、69.14%、70.37%、62.96%。选用径向基核函数,网格搜索参数优化前后(未优化:c=1,g=0.05;优化后:c=16,g=0.0625)训练集和测试集数据准确率分别为59.09%、69.01%和70.37%、67.90%。<br> 经单因素分析纳入Logistic回归分析的变量有白细胞计数、收缩压、尿素、血清钠离子、血清钙离子、体温、心率、舒张压、血清淀粉酶、血清脂肪酶、腹痛时间、器官衰竭、胸腔积液。经Logistic回归分析,最终纳入特征变量有:白细胞计数、血清钙离子、血清脂肪酶、收缩压、舒张压以及有无胸腔积液。<br> 选用径向基核函数,结合网格搜索和交叉验证方法选择最优参数,基于选取特征变量,再次建立分类模型。c最优值为2,g最优值为1,模型支持向量数为180,训练集和测试集准确率分别为65.29%、70.37%。生成SAPSVM setup.exe安装程序。SAPSVM安装文件包括sapfile.zip、setup.exe、安装说明。只需按照安装说明将sapfile文件解压后复制到程序安装目录下,点击setup.exe默认安装。SAPSVM涉及白细胞计数、血清钙离子、血清脂肪酶、收缩压、舒张压以及有无胸腔积液6项指标。<br> 采用测试集数据对预测模型的性能进行客观评估,其中SAP类设为正类、非SAP类设为负类,测试集81个样本中,经程序预测后其中真正样本数12、假负样本数18、假正样本数6、真负样本数45。SAPSVM预测准确率、灵敏度、特异度、阳性预测值、阴性预测值分别为70.37%、40%、88.24%、66.7%、71.43%。相同测试集样本BISAP评分系统准确率、灵敏度、特异度、阳性预测值、阴性预测值分别为48.12%、30%、58.82%、30%、58.82%。<br> 结论:<br> 本研究利用支持向量机基于电子病历构建重度急性胰腺炎预测模型,进一步基于COM组件实现混合编程开发设计早期预测Windows应用程序,预测性能较为理想。本研究特点包括:采用文字型及数值型电子病历数据构建疾病早期预测模型;利用支持向量机构建预测模型后结合统计学方法筛选特征变量,而后再基于特征变量建立最终预测模型,提高准确率的同时简化模型;基于VB.NET开发设计Windows应用程序,以期嵌入医院信息系统,辅助临床决策。
更多相关知识
- 浏览0
- 被引3
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文