核心观点
农作物病虫害识别面临着数据集长尾效应和小目标识别困难的问题。本研报针对这一问题,提出了一种基于深度学习的农田害虫图像识别方法,并取得了显著的识别效果。
关键数据
- 原数据集中包含3015张图片,其中576张含有害虫目标,1019个目标被标注。
- 数据集存在明显的长尾效应,部分害虫种类样本数量不足5个。
- 害虫目标之间存在多尺度变化问题,类间和类内目标面积差异较大。
- 通过数据增强,将1019个目标扩充至4401个目标,并按7:1的比例划分训练集和测试集。
研究方法
- 数据预处理:
- 针对长尾效应,采用离线数据增强方法,包括常规数据增强、Copy and Paste以及目标与背景融合操作。
- 针对多尺度问题,采用多尺度训练和测试策略。
- 模型选择:
- 采用两阶段目标检测算法Cascade Mask RCNN和Swin-S Cascade Mask RCNN作为基本框架。
- Swin-Transformer模型作为特征提取网络,其性能优于经典的CNN架构。
- 模型改进:
- 使用K-means聚类确定锚框长宽比,以适应数据集中目标检测框的不同宽高比。
- 使用Smooth L1损失函数和Soft NMS,提升模型对小目标的识别效果。
- 模型融合:
- 对两个模型不同epoch的权重进行SWA(随机权重平均)。
- 将SWA后的Resnet50 Cascade Mask RCNN训练模型和Swin-S Cascade Mask RCNN 训练模型进行多模型融合,并对检测结果进行NMS处理。
研究结论
- 相比于Faster RCNN、Mask RCNN和Cascade Mask RCNN,Swin-S Cascade Mask RCNN模型在mAP指标上表现更优。
- 结合SWA和NMS的多模型融合策略,能够进一步提升模型的识别性能,mAP指标达到0.876。
- 本方法能够有效识别农田害虫,为农作物病虫害的处理提供了一种新的思路。