LUD-YOLO:兼顧精度與速度的無人機小目標(biāo)檢測輕量新方案
1. 一眼概覽
LUD-YOLO 提出了一種基于 YOLOv8 的輕量級小目標(biāo)檢測網(wǎng)絡(luò),結(jié)合自適應(yīng)多尺度特征融合和稀疏注意力機制,在保持高檢測精度的同時實現(xiàn)高效 UAV 部署。
2. 核心問題
現(xiàn)有 UAV 目標(biāo)檢測面臨圖像復(fù)雜背景、小目標(biāo)難識別、設(shè)備資源受限等問題。如何在有限算力和存儲條件下實現(xiàn)高精度的小目標(biāo)實時檢測,是本文關(guān)注的關(guān)鍵挑戰(zhàn)。
3. 技術(shù)亮點
- 自適應(yīng)多尺度特征融合(AFPN):通過自適應(yīng)空間融合機制強化多層級語義信息交互,緩解特征傳播退化;
- 動態(tài)稀疏注意力模塊(C2f-BRA):融合稀疏表達(dá)與自注意力,實現(xiàn)長距離上下文建模與計算分配優(yōu)化;
- 網(wǎng)絡(luò)瘦身(Network Slimming):在保持精度的前提下裁剪不敏感卷積通道,實現(xiàn)極致輕量化模型部署。
4. 方法框架
圖片
LUD-YOLO 的結(jié)構(gòu)改進(jìn)包括三大部分:
? 特征融合改進(jìn):在 YOLOv8 的 FPN+PAN 結(jié)構(gòu)中插入 C2→C5 的上采樣通路,構(gòu)建 AFPN,提升低層細(xì)節(jié)與高層語義信息融合質(zhì)量;
? 特征提取增強:在 YOLOv8 的 C2f 模塊中引入 Biform 模塊,通過 Top-k 動態(tài)稀疏圖機制實現(xiàn)高效注意力;
? 模型輕量化處理:通過 BN 層 L1 正則剪枝卷積通道,結(jié)合微調(diào)恢復(fù)精度,最終獲得部署友好型檢測模型。
5. 實驗結(jié)果速覽
? VisDrone2019 數(shù)據(jù)集:LUDY-S 的 mAP 達(dá) 41.7%,比 YOLOv5-S 提高 3.2%,且參數(shù)僅 10.34M;LUDY-N 更是以 2.81M 參數(shù)量實現(xiàn) 35.2% mAP,為同類模型中最輕;
? UAVDT 數(shù)據(jù)集:LUDY-S mAP 達(dá) 86.2%,優(yōu)于 YOLOv8-s 的 83.1%;
? 對比實驗表明:在多種輕量模型中,LUD-YOLO 在 mAP、FPS、模型大小之間取得最佳平衡。
6. 實用價值與應(yīng)用
LUD-YOLO 適用于無人機在農(nóng)業(yè)巡檢、安防監(jiān)控、交通執(zhí)法等實際場景中的邊緣部署需求,尤其在復(fù)雜環(huán)境中的小目標(biāo)檢測任務(wù)中展現(xiàn)出出色性能與部署價值。
7. 開放問題
? LUD-YOLO 是否可進(jìn)一步適應(yīng)少樣本或無標(biāo)注數(shù)據(jù)場景?
? 動態(tài)稀疏注意力機制是否可遷移至視頻流中的連續(xù)目標(biāo)跟蹤任務(wù)?
? 模型剪枝策略是否適用于 Transformer 主干網(wǎng)絡(luò)?