基于深度特征融合的鸟鸣识别方法及其可解释性分析
A deep feature fusion-based method for bird sound recognition and its interpretability analysis
摘要鸟鸣识别是生态监测的重要手段,为进一步提升鸟鸣识别的准确性和鲁棒性,本文提出了 1种新的基于深度特征融合的鸟鸣识别方法.该方法首先利用深度特征提取网络对鸟鸣的对数梅尔谱图和补充特征集的深度特征进行提取,再将两种深度特征进行融合,最后使用轻量级梯度提升机(light gradient boosting machine,lightGBM)分类器进行分类.本文充分利用深度神经网络的特征提取能力以及lightGBM的分类性能,将特征提取和特征分类过程进行分离,从而实现了高准确率的鸟鸣识别.实验结果显示,本文提出的方法在北京百鸟数据集中取得了目前已知的最佳结果,模型的平均准确率达到了98.70%,平均F1分数达到了98.84%.相比传统方法,深度融合特征在鸟鸣识别任务上准确率提升了5.62%以上.同时,引入的lightGBM分类器使分类准确率提升了3.02%.此外,在CLO-43SD和BirdCLEF2022比赛的数据集中,本文方法也展现出卓越的性能,分别取得了98.32%和91.12%的平均准确率.本文还引入了类激活图对不同类型鸟鸣的识别结果进行可解释性分析,揭示了神经网络对不同类型鸟鸣的注意力区域差异,为后续的特征选择和模型优化提供了理论依据.研究结果表明,本文方法有效提高了鸟鸣识别的准确率,在3个数据集的测试中均展现出较好的性能,能够为基于鸟鸣识别的生态监测提供有力的技术支撑.
更多相关知识
- 浏览3
- 被引7
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



