微軟開源計算機(jī)視覺專題庫在GitHub上又火了
近年來,微軟在計算機(jī)視覺領(lǐng)域取得了巨大的進(jìn)步,其應(yīng)用在人臉識別,圖像理解,搜索,無人機(jī),地圖,半自動和自動駕駛等領(lǐng)域。
微軟開源了計算機(jī)視覺庫,涵蓋了計算機(jī)視覺領(lǐng)域的最佳實踐、代碼示例和豐富文檔——computervision-recipes,該存儲庫專門為數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師準(zhǔn)備的,本周登上了GitHub熱榜,標(biāo)星5.3K,累計分支 608 個(GitHub地址:https://github.com/microsoft/computervision-recipes)
computervision-recipes旨在構(gòu)建一套全面的計算機(jī)視覺工具和代碼示例,以利用最先進(jìn)的計算機(jī)視覺算法、神經(jīng)系統(tǒng)構(gòu)建等。當(dāng)然這個庫并非是從零開始教你創(chuàng)建實現(xiàn),而是從現(xiàn)有的最先進(jìn)的庫中提取并構(gòu)建關(guān)于加載圖像數(shù)據(jù)、優(yōu)化和評估模型以及擴(kuò)展到云的附加實用程序。
除此之外,微軟表示:由于在這一領(lǐng)域工作多年,因此我們的目標(biāo)是通過這個項目解答視覺領(lǐng)域的常見問題,指出顯而易見的Bug,并展示如何使用云進(jìn)行訓(xùn)練和部署。
示例
該存儲庫支持在單個圖像上運行的各種計算機(jī)視覺方案:
以及將視頻序列作為輸入的諸如動作識別之類的場景:
以下是該庫涵蓋常用的計算機(jī)視覺場景,包含如下類別:
對于每個主要場景(base),該項目均提供使用戶高效構(gòu)建自己模型的工具。這需要使用者完成一些任務(wù),如基于自己的數(shù)據(jù)微調(diào)模型的簡單任務(wù),或者難例挖掘甚至模型部署等更復(fù)雜的任務(wù)。
如果你對這個項目感興趣,趕緊到GitHub詳情頁學(xué)習(xí)一下吧。



































