擊敗剩下的0.02%人類選手
今年10月30日
DeepMind在《自然》雜志上
發(fā)表的一篇論文
仿佛又一次把人們的視線
拉回了兩年前的那場
“世紀(jì)大戰(zhàn)”之中
不過,這回的主角不是
“阿爾法狗”(AlphaGo)
而是AlphaStar
這位《星際爭霸2》玩家
在歐洲服務(wù)器擊敗了
99.8%人類選手
有同學(xué)聽后不以為然
“也沒有掃遍天下無敵手嘛。”
然而事實是
一局典型《星際爭霸》游戲的
搜索空間大約是一盤典型
圍棋棋局的101799640倍
而要擊敗剩下的0.02%人類選手
也只是個時間問題
從深藍(lán)到AlphaGo
再到AlphaStar
過去10年,人工智能在機(jī)器視覺、
深度學(xué)習(xí)、自然語言處理
等領(lǐng)域取得了重大突破
而在這條道路上
計算力是重要的推動力
OpenAI在2018年一份研究報告顯示:2012年起,AI消耗的計算力平均每3.43個月增長一倍,過去6年時間內(nèi)已經(jīng)增長30萬倍。GPU計算是當(dāng)下AI深度學(xué)習(xí)訓(xùn)練和推理計算的首選架構(gòu),F(xiàn)PGA與ASIC亦在積蓄力量。
戴爾科技集團(tuán)持續(xù)投入到AI計算解決方案研究,并將我們的研究成果、效能測試、技術(shù)白皮書,分享給用戶及TensorFlow、Caffe、MXNet等主流開源框架社區(qū)。戴爾易安信在DSS8440、C4140、R740、R740xd、R940xa、R840、R7425、T640、XR2等多款服務(wù)器上,提供超過50種AI GPU加速配置方案支持,總有一款可以滿足您的需求。
全方位的AI GPU加速配置方案
總有一款可以滿足您
DSS8440
DSS8440是戴爾易安信設(shè)計的一款動態(tài)機(jī)器學(xué)習(xí)加速平臺,4U機(jī)箱可以支持最多10張Nvidia當(dāng)前性能最高的V100加速卡或者8張戴爾投資AI芯片企業(yè)GraphcoreIPU ASIC加速卡,適合于各種AI計算環(huán)境下深度學(xué)習(xí)模型訓(xùn)練。DSS8440提供更強(qiáng)的環(huán)境適應(yīng)能力,支持在35℃環(huán)境下205W CPU以及GPU加速器。
C4140是戴爾易安信為AI計算精心打造的另外一款智能計算神器。C4140機(jī)箱只有1U,卻可以在有限的空間內(nèi)支持4張最高性能的雙寬GPU加速卡、本地NVMe SSD硬盤以及100Gb低延遲網(wǎng)卡,為用戶提供極佳的數(shù)據(jù)中心空間GPU計算密度。
R940xa
當(dāng)前很多復(fù)雜的AI應(yīng)用場景,往往使用多種算法的集成學(xué)習(xí),以達(dá)到更好的模型精度,解決小數(shù)據(jù)樣本下的機(jī)器學(xué)習(xí),比如工業(yè)產(chǎn)品外觀缺陷檢測。而不同算法可能會選擇不同的計算介質(zhì),比如深度學(xué)習(xí)選擇GPU,經(jīng)典機(jī)器學(xué)習(xí)使用CPU。此時,戴爾易安信R940xa四路計算加速服務(wù)器,可以提供CPU與GPU 1:1的計算配比,幫助用戶應(yīng)對復(fù)雜集成學(xué)習(xí)環(huán)境下模型訓(xùn)練加速。
R740
同時,隨著AI產(chǎn)業(yè)化不斷深入,推理計算需求增速明顯。戴爾易安信R740服務(wù)器也在AI推理計算場景中廣泛采用,2U機(jī)箱可以支持8張T4或P4 GPU。R740提供多矢量散熱技術(shù),可針對不同GPU卡運(yùn)行工作負(fù)載智能調(diào)節(jié)風(fēng)扇轉(zhuǎn)速。
此外,隨著AI計算朝向邊緣端進(jìn)展,很多場景下如工業(yè)生產(chǎn)線、移動通信基站、變電站等,對散熱、防塵等環(huán)境參數(shù)要求更加苛刻。而戴爾易安信XR2服務(wù)器搭載NvidiaT4,采用工業(yè)加固型服務(wù)器設(shè)計,提供臟亂、多塵環(huán)境下的過濾擋板,機(jī)箱深度僅為20英寸,復(fù)合嚴(yán)格的海事和軍用標(biāo)準(zhǔn),可以適應(yīng)復(fù)雜嚴(yán)苛環(huán)境下AI邊緣計算需求。
戴爾易安信聯(lián)合驅(qū)動科技
為用戶構(gòu)建數(shù)據(jù)中心級AI資源池
IT軟件及硬件,一文一武,相得益彰。好的硬件設(shè)施,也需要好的資源管理與調(diào)度軟件,以實現(xiàn)AI計算資源的按需分配和隨需擴(kuò)展。戴爾易安信聯(lián)合AI計算平臺合作伙伴趨動科技,基于獵戶座AI軟件實現(xiàn)GPU虛擬化,為用戶構(gòu)建數(shù)據(jù)中心級AI資源池,應(yīng)用無需修改即可透明共享和使用數(shù)據(jù)中心內(nèi)任何服務(wù)器上的AI加速器。
“化整為零”
支持將一塊物理GPU細(xì)粒度分割為多塊虛擬GPU,分配給多個虛擬機(jī)或容器同時使用,實現(xiàn)GPU資源的高效共享,提高AI計算資源利用率。有別于傳統(tǒng)GPU虛擬化只切割顯存,CUDA核心只能時分復(fù)用方式,獵戶座AI計算平臺可以實現(xiàn)虛擬GPU顯存和算力的獨立配置和限制。顯存和算力,既支持顯存和CUDA計算核心的等比例分配,也支持非等比例分配,從而提高資源利用率,降低成本。
“化零為整”
支持將單臺以及多臺服務(wù)器的GPU資源提供給一個虛擬機(jī)或容器使用,AI應(yīng)用無需修改代碼。用戶可以將多臺物理服務(wù)器計算資源聚合后提供給單一應(yīng)用使用,為用戶的AI應(yīng)用提供數(shù)據(jù)中心級超級算力,同時對應(yīng)用透明。
“隔空取物”
支持將虛擬機(jī)或容器運(yùn)行在一臺沒有物理GPU的服務(wù)器上,透明地使用另外一臺服務(wù)器上的GPU資源,而無需修改AI應(yīng)用代碼。借助這項功能,用戶可以構(gòu)建數(shù)據(jù)中心級GPU資源池,應(yīng)用可以無障礙地部署到數(shù)據(jù)中心內(nèi)的任意服務(wù)器,并能夠透明地使用任意服務(wù)器之上的GPU資源。
“隨需應(yīng)變”
支持用戶在虛擬機(jī)或者容器的生命周期內(nèi),動態(tài)分配和釋放GPU計算資源,實現(xiàn)真正的GPU資源動態(tài)伸縮,極大提升了GPU資源調(diào)度的靈活度。
獵戶座AI計算平臺,可以在極少性能損耗下,實現(xiàn)GPU計算資源虛擬化,按需分配,靈活擴(kuò)展和應(yīng)用透明。
在之前進(jìn)行的一項基于Nvidia Tesla P40的測試中,用例運(yùn)行在物理GPU、虛擬GPU容器環(huán)境、虛擬GPUKVM虛擬機(jī)環(huán)境,以及通過25Gb ROCE網(wǎng)卡使用遠(yuǎn)程虛擬GPU資源,運(yùn)行VGG16、ResNet50、ResNet152、Inception3主流圖像分類模型訓(xùn)練,虛擬GPU與物理GPU性能差距幾乎可以忽略不計。
通過適用于不同場景、不同AI應(yīng)用負(fù)載的AI加速服務(wù)器硬件,以及提供創(chuàng)新AI虛擬化技術(shù)的獵戶座軟件平臺,我們?yōu)閿?shù)據(jù)科學(xué)家提供一套高效經(jīng)濟(jì)的AI計算平臺。未來的AI計算平臺,將如同我們兒時手中的魔方,隨著數(shù)據(jù)科學(xué)家的需要,快速變換出應(yīng)用所需的AI計算資源,為拓展人工智能邊界提供有利的計算利器。