偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

yolov部署到iPhone或終端實踐全過程

人工智能 開發(fā)
本文假設(shè)這些通用特征包括加權(quán)剩余連接(WRC)、跨階段部分連接(CSP)、跨小批量規(guī)范化(CmBN)、自對抗訓(xùn)練(SAT)和Mish激活。

本文經(jīng)計算機(jī)視覺研究院公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

期待已久的檢測經(jīng)典又來來了一波強(qiáng)襲——yolov5。其實yolov5沒有完整的文件,現(xiàn)在最重要的應(yīng)該是把yolov4弄清楚,在目標(biāo)檢測領(lǐng)域中受益匪淺,可以在某些場景得到較高的提升。今天我們還是給大家分享yolov4,下一期我們將實踐得將yolov5部署到蘋果手機(jī)或者在終端通過攝像頭實時檢測!

一、技術(shù)回顧

有大量的特征被認(rèn)為可以提高卷積神經(jīng)網(wǎng)絡(luò)(CNN)的精度。需要在大型數(shù)據(jù)集上對這些特征的組合進(jìn)行實際測試,并對結(jié)果進(jìn)行理論驗證。某些功能只對某些模型進(jìn)行操作,某些問題只對某些模型進(jìn)行操作,或只對小規(guī)模數(shù)據(jù)集進(jìn)行操作;而某些功能(如批處理規(guī)范化和剩余連接)則適用于大多數(shù)模型、任務(wù)和數(shù)據(jù)集。本文假設(shè)這些通用特征包括加權(quán)剩余連接(WRC)、跨階段部分連接(CSP)、跨小批量規(guī)范化(CmBN)、自對抗訓(xùn)練(SAT)和Mish激活。本文使用了新功能:WRC、CSP、CmBN、SAT、誤激活、馬賽克數(shù)據(jù)增強(qiáng)、CmBN、DropBlock正則化和CIoU丟失,并將其中一些功能結(jié)合起來,以達(dá)到以下效果:43.5%的AP(65.7%的AP50)用于MS COCO數(shù)據(jù)集,在Tesla V100上以65 FPS的實時速度。

圖片

二、創(chuàng)新點分析

Mosaic數(shù)據(jù)增強(qiáng)

把四張圖拼成一張圖來訓(xùn)練,變相的等價于增大了mini-batch。這是從CutMix混合兩張圖的基礎(chǔ)上改進(jìn);

圖片

Self-Adversarial Training

在一張圖上,讓神經(jīng)網(wǎng)絡(luò)反向更新圖像,對圖像做改變擾動,然后在這個圖像上訓(xùn)練。這個方法,是圖像風(fēng)格化的主要方法,讓網(wǎng)絡(luò)反向更新圖像來風(fēng)格化圖像。

Self-Adversarial Training (SAT) also represents a new data augmentation technique that operates in 2 forward backward stages. In the 1st stage the neural network alters the original image instead of the network weights. In this way the neural network executes an adversarial attack on itself, altering the original image to create the deception that there is no desired object on the image. In the 2nd stage, the neural network is trained to detect an object on this modified image in the normal way.

圖片

Cross mini-batch Normal

CmBN表示CBN修改的版本,如下圖所示,定義為 Cross mini-Batch Normalization(CMBN)。這只收集單個批次內(nèi)最小批次之間的統(tǒng)計數(shù)據(jù)。

圖片

modify SAM

圖片

圖片

從SAM的逐空間的attention,到逐點的attention修改的PAN,把通道從相加(add)改變?yōu)閏oncat。

 實驗 

圖片

以數(shù)據(jù)增強(qiáng)方法為例,雖然增加了訓(xùn)練時間,但可以讓模型泛化性能和魯棒性更好。例如下面的常見增強(qiáng)方法:

  • 圖像擾動,
  • 改變亮度、對比對、飽和度、色調(diào)
  • 加噪聲
  • 隨機(jī)縮放
  • 隨機(jī)裁剪(random crop)
  • 翻轉(zhuǎn)
  • 旋轉(zhuǎn)
  • 隨機(jī)擦除(random erase)
  • Cutout
  • MixUp
  • CutMix

通過實驗看得出,用了很多tricks,簡直就是目標(biāo)檢測最強(qiáng)萬花筒,下表是對分類網(wǎng)絡(luò)的實驗:

CSPResNeXt-50 classifier accuracy

圖片

CSPDarknet-53 classifier accuracy

圖片

在YOLOv4檢測網(wǎng)絡(luò)上,對比了四個loss(GIoU、CIoU、DIoU、MSE),標(biāo)簽平滑,Cosine學(xué)習(xí)率,遺傳算法選超參數(shù),Mosaic數(shù)據(jù)增強(qiáng)等各種方法。下表是YOLOv4檢測網(wǎng)絡(luò)上的消融實驗結(jié)果:

CSPResNeXt50-PANet-SPP, 512x512

圖片


圖片

使用不同與訓(xùn)練權(quán)重模型用于訓(xùn)練:

圖片

不同的mini-batch size結(jié)果:

圖片

最后,是在Maxwell、Pascal、Volta三個不同系列的GPU,在COCO 數(shù)據(jù)集上的結(jié)果對比:

圖片

最勁爆的是,在COCO數(shù)據(jù)集,與其他框架比較(速度和精度):

圖片

圖片

圖片

圖片


責(zé)任編輯:張燕妮 來源: 計算機(jī)視覺研究院
相關(guān)推薦

2011-07-20 14:04:46

Cocos2d iPhone 游戲

2011-02-22 10:46:02

Samba配置

2009-12-08 17:56:16

WCF配置

2011-04-18 15:56:10

軟件測試

2009-04-13 12:37:18

2011-09-06 15:38:20

QT安裝

2011-01-21 17:51:52

2010-11-19 10:11:49

Oracle物化視圖

2010-06-17 13:10:09

Linux Grub修

2009-06-10 16:55:42

cygwin netb安裝

2010-03-10 13:24:45

Zend Debugg

2010-03-01 17:01:03

Python編程技巧

2012-11-06 10:19:18

Java自定義加載Java類

2024-01-03 10:12:07

Kubernetesdeploymentpod

2011-03-11 10:39:02

YUM安裝LAMP

2010-06-12 10:03:20

Ubuntu Grub

2010-07-21 14:51:19

telnet-serv

2019-05-14 15:27:31

MongoDB自動備份數(shù)據(jù)庫

2025-06-04 02:35:00

2009-12-15 16:51:32

點贊
收藏

51CTO技術(shù)棧公眾號