偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

新聞 前端
屠榜各大 CV 任務(wù)的微軟 Swin Transformer,近日開源了代碼和預(yù)訓(xùn)練模型。

  [[393557]]

自 2017 年 6 月谷歌提出 Transformer 以來,它便逐漸成為了自然語言處理領(lǐng)域的主流模型。最近一段時間,Transformer 更是開啟了自己的跨界之旅,開始在計算機視覺領(lǐng)域大展身手,涌現(xiàn)出了多個基于 Transformer 的新模型,如谷歌用于圖像分類的 ViT 以及復(fù)旦、牛津、騰訊等機構(gòu)的 SETR 等。由此,「Transformer 是萬能的嗎?」也一度成為機器學(xué)習(xí)社區(qū)的熱門話題。

不久前,微軟亞研的研究者提出了一種通過移動窗口(shifted windows)計算的分層視覺 Transformer,他們稱之為 Swin Transformer。相比之前的 ViT 模型,Swin Transformer 做出了以下兩點改進(jìn):其一,引入 CNN 中常用的層次化構(gòu)建方式構(gòu)建分層 Transformer;其二,引入局部性(locality)思想,對無重合的窗口區(qū)域內(nèi)進(jìn)行自注意力計算。

論文鏈接:

https://arxiv.org/pdf/2103.14030.pdf

首先來看 Swin Transformer 的整體工作流,下圖 3a 為 Swin Transformer 的整體架構(gòu),圖 3b 為兩個連續(xù)的 Swin Transformer 塊。

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

該研究的亮點在于利用移動窗口對分層 Transformer 的表征進(jìn)行計算。通過將自注意力計算限制在不重疊的局部串口,同時允許跨窗口連接。這種分層結(jié)構(gòu)可以靈活地在不同尺度上建模,并具有圖像大小的線性計算復(fù)雜度。下圖 2 為在 Swin Transformer 架構(gòu)中利用移動窗口計算自注意力的工作流:

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

模型本身具有的特性使其在一系列視覺任務(wù)上都實現(xiàn)了頗具競爭力的性能表現(xiàn)。其中,在 ImageNet-1K 數(shù)據(jù)集上實現(xiàn)了 86.4% 的圖像分類準(zhǔn)確率、在 COCO test-dev 數(shù)據(jù)集上實現(xiàn)了 58.7% 的目標(biāo)檢測 box AP 和 51.1% 的 mask AP。目前,在 COCO minival 和 COCO test-dev 兩個數(shù)據(jù)集上,Swin-L(Swin Transformer 的變體)在目標(biāo)檢測和實例分割任務(wù)中均實現(xiàn)了 SOTA。

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

此外,在 ADE20K val 和 ADE20K 數(shù)據(jù)集上,Swin-L 也在語義分割任務(wù)中實現(xiàn)了 SOTA。

開源代碼和預(yù)訓(xùn)練模型

Swin Transformer 論文公開沒多久之后,微軟官方于近日在 GitHub 上開源了代碼和預(yù)訓(xùn)練模型,涵蓋圖像分類、目標(biāo)檢測以及語義分割任務(wù)。上線僅僅兩天,該項目已收獲 1900 星。

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

項目地址:

https://github.com/microsoft/Swin-Transformer

首先圖像分類任務(wù),Swin-T、Swin-S、Swin-B 和 Swin-L 變體模型在 ImageNet-1K 和 ImageNet-22K 數(shù)據(jù)集上的準(zhǔn)確率結(jié)果如下:

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

其次目標(biāo)檢測任務(wù):Swin-T、Swin-S、Swin-B 和 Swin-L 變體模型在 COCO 目標(biāo)檢測(2017 val)數(shù)據(jù)集上的結(jié)果如下:

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

最后語義分割任務(wù):Swin-T、Swin-S、Swin-B 和 Swin-L 變體模型在 ADE20K 語義分割(val)數(shù)據(jù)集上的結(jié)果如下。目前,Swin-L 取得了 53.50% 的 SOTA 驗證 mIoU 分?jǐn)?shù)。

霸榜多個CV任務(wù),開源僅兩天,微軟分層ViT模型收獲近2k star

 

 

責(zé)任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2021-04-25 15:35:30

開源技術(shù) 軟件

2019-03-29 09:24:36

國內(nèi)程序員微博GitHub

2020-04-30 09:30:32

Linux 監(jiān)視器 GitHub

2023-11-15 16:07:01

模型訓(xùn)練

2020-11-19 15:23:08

GitHub代碼工具

2020-02-10 14:29:46

GitHub新冠受肺炎項目

2021-01-01 19:24:12

程序員GitHub茅臺

2011-08-29 10:40:19

Spy MouseApp Store推廣方法

2020-05-19 09:25:33

VSCode 流程圖開源

2019-05-08 15:27:15

命令Windows微軟

2021-03-29 10:05:49

GitHub代碼開發(fā)者

2009-02-01 13:46:54

2023-09-21 10:30:05

AI開源

2023-11-05 10:01:37

AI模型

2024-07-15 08:58:00

2016-12-22 16:15:45

微軟開源.Net

2025-04-24 09:21:00

2020-07-15 15:21:06

谷歌開源機器學(xué)習(xí)

2019-12-18 15:28:05

編程語言PythonJava

2020-12-30 13:20:50

茅臺開源GitHub
點贊
收藏

51CTO技術(shù)棧公眾號