基于面部视频的非接触式血氧饱和度估计方法
Non-contact Estimation Method of Blood Oxygen Saturation Based on Facial Videos
摘要针对远程光电容积描记法(rPPG)在非接触式血氧饱和度(SpO2)测量中存在的时空特征建模不足以及复杂场景下鲁棒性差的挑战,提出了一种趋势感知时空融合网络(trend-aware spatio-temporal fusion network,TAST-Net).该网络通过一个创新的双路融合架构,将3D卷积神经网络(3D CNN)分支提取的局部生理特征与ViViT(video vision transformer)分支捕捉的全局时空依赖进行协同融合.为增强模型对信号动态变化的敏感性,设计了一种结合均方误差与皮尔逊相关性损失的加权组合损失函数.在2个公开数据集上的实验结果表明,TAST-Net表现出优秀的性能:在PURE(pulse rate estimation)数据集上均方根误差(eRMS)为0.53%,平均绝对误差(eMA)为 0.37%,皮尔逊相关系数(R)为 0.96;在更具挑战性的VIPL-HR(visual information processing and learning-heart rate)数据集上,eRMS为0.84%,eMA为0.57%,R为0.82,其综合性能优于其他对比方法.研究结果表明,TAST-Net为从面部视频中实现准确、稳健的SpO2估计提供了一个有效的方案,并验证了融合局部与全局特征策略在rPPG信号处理中的有效性.
更多相关知识
- 浏览1
- 被引0
- 下载1

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



