基于孤立损失和深度自编码器的医保欺诈识别算法
Medical insurance fraud identification based on isolation loss and deep autoencoder
摘要针对医保欺诈识别中欺诈样本与正常样本之间的高相似性、区分度不高问题以及边缘正常样本的迷惑性问题,本文提出了基于孤立损失(isolation loss)和深度自编码器(deep autoencoder)的医保欺诈识别算法(ISDAE).该算法针对边缘欺诈样本和稀疏欺诈样本的易隔离性,提出了样本的孤立度度量,旨从特征分布角度量化分析两类样本的差异.在此基础上,利用DAE对医保线性和非线性特征的挖掘能力,并综合考虑边缘正常样本对模型训练的干扰,在潜在特征空间中定义了孤立损失以实现中心正常样本的聚集和边缘正常样本的分离,从而增大欺诈样本和正常样本的差异;然后,通过集成孤立度值和重构误差来评估样本的欺诈程度,提高模型的欺诈识别性能.最后在天池医保数据集上对所提算法的性能进行了验证,结果表明本文所提ISDAE算法的整体欺诈识别能力优于对比方法,且其性能表现更加稳定.
更多相关知识
- 浏览2
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



