偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

戴爾易安信DSS 8440服務(wù)器|業(yè)界首款采用Graphcore技術(shù)的機器學(xué)習(xí)服務(wù)器

作者：Zeng, Oscar 2021-01-07 17:24:13

企業(yè)動態(tài)

戴爾易安信豐富的機器學(xué)習(xí)專業(yè)知識，經(jīng)典機器學(xué)習(xí)、深度學(xué)習(xí)的硬件和解決方案，能夠幫助AI 技術(shù)開發(fā)、研發(fā)型的初創(chuàng)小企業(yè)，快速部署穩(wěn)定可靠且高算力的基礎(chǔ)架構(gòu)產(chǎn)品，支持創(chuàng)新研發(fā)提高其核心競爭力。

在過去的一年里，許多行業(yè)受疫情沖擊發(fā)展陷入停滯，人工智能應(yīng)用卻實現(xiàn)了逆勢突破。在世界人工智能大會WAIC2020上，李蘭娟院士表示，AI在疫情防控中，發(fā)揮了重要作用。

此外，AI在無人駕駛汽車等前沿領(lǐng)域也持續(xù)發(fā)力；在AI頂層設(shè)計方面，國家也不遺余力積極制定相關(guān)標(biāo)準(zhǔn)，出臺了《國家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》，為人工智能的規(guī)范發(fā)展掃平障礙。

[[374462]]

AI高速發(fā)展的背后，離不開“燃料”算力的助推。算力作為AI 2.0的四大要素之一，為人工智能提供計算能力的支撐。

需求倒逼創(chuàng)新

AI芯片行業(yè)將迎變革

在過去的幾十年里，基于摩爾定律，芯片行業(yè)的發(fā)展一直推動著芯片制程和性能的穩(wěn)步提升，算力需求的增長也促進(jìn)了人工智能工作負(fù)載中大量采用專用的AI加速器（GPU、FPGA、ASIC、xPU等）。

與傳統(tǒng)的CPU架構(gòu)相比，這些加速器能夠執(zhí)行更快的AI作業(yè)和并行計算。它們?yōu)橛行?zhí)行控制ML/DL工作負(fù)載提供了專門的支持。

現(xiàn)在市場上已經(jīng)有各類 AI加速器：GPU、FPGA、ASIC等等，各種各樣的計算平臺被運用到AI計算中。之所以會出現(xiàn)這么多各種形式的 AI 芯片，正是因為算法的多元化，例如機器學(xué)習(xí)算法有 LR、GBDT，深度學(xué)習(xí)中的 CNN、DNN 等，這些算法都非常復(fù)雜，如果機器要很快地讓這些算法“跑”起來，一定需要算法的邏輯跟芯片計算的邏輯相互匹配。

據(jù)OpenAI組織發(fā)布的一份分析報告顯示，自2012年以來，在人工智能訓(xùn)練中所使用的計算量呈指數(shù)級增長，3.5個月的時間計算量就翻了一倍（相比之下，摩爾定律有18個月的倍增周期）。自2012年以來，該指標(biāo)增長了30多萬倍。按照這個趨勢，想要滿足未來AI發(fā)展的需求，芯片行業(yè)勢必要有所變革。

Graphcore IPU：專為人工智能而生

一種全新的完全可編程處理器

Graphcore是一家創(chuàng)辦于2016年的人工智能芯片設(shè)計初創(chuàng)公司，總部位于英國，以“專注于新型 AI 處理器架構(gòu)，專門適用于算力密集型的機器學(xué)習(xí)任務(wù)”，入選2020年度《麻省理工科技評論》“50家聰明公司”榜單。該公司開發(fā)了一款被稱為IPU智能處理單元(intelligence processing unit)的新型AI加速器。

Graphcore IPU是專門為AI/Machine Learning設(shè)計的處理器，擁有完全不同于前面幾類處理器類型的全新架構(gòu)，能夠提供強大的并行處理能力。Graphcore IPU區(qū)別于其他處理器的一個重要因素還在于，它實現(xiàn)了快速訓(xùn)練模型和實時操控，這使得它能夠在自然語言處理以及理解自動駕駛方面取得重大進(jìn)展。

Graphcore 的IPU特點可概括為：

同時支持 Training 和 Inference；
采用同構(gòu)多核（many-core）架構(gòu)，超過1000個獨立的處理器；
支持 all-to-all的核間通信，采用Bulk Synchronous Parallel的同步計算模型；
采用大量片上SRAM，不需要外部DRAM。

據(jù)介紹，IPU處理器是迄今為止最復(fù)雜的處理器芯片，它在一個16納米芯片上有幾乎240億個晶體管，每個芯片提供125 teraFLOPS運算能力。一個標(biāo)準(zhǔn)4U機箱中可以插入8張卡，卡間通過IPU-Link互連。8張卡上的IPU可以看做一個處理器工作，提供 1.6PetaFLOPS的運算能力。

與GPU爭鋒？

IPU：沒在怕的

英偉達(dá)公司率先于1999年提出GPU的概念，GPU使顯卡減少了對CPU的依賴，然而隨著模型越來越大，參數(shù)越來越多，面對高精度高吞吐量的需求，算力優(yōu)勢顯著的IPU也許更能代表AI芯片的發(fā)展方向。

Graphcore IPU在現(xiàn)有以及下一代模型上的性能均優(yōu)于GPU，在自然語言處理方面的速度能比GPU快25%到50%；在圖像分類方面，吞吐量7倍于GPU，而且時延更低。

Natural Language Processing-BERT

BERT (Bidirectional Encoder Representations from Transformers)是目前使用的最著名的NLP模型之一。IPU加速了BERT的訓(xùn)練和推理，在極低延遲的情況下， IPU能夠進(jìn)行實現(xiàn)2倍于目前解決方案的吞吐量，同時延遲性能比當(dāng)前的解決方案提升1.3倍。

計算機視覺：EfficientNet & ResNeXt模型

由于IPU架構(gòu)的特定特性，它非常擅長于分組卷積的模型。在計算機視覺模型如efficient entnet和ResNeXt中顯著提升了訓(xùn)練和推理的性能。

在EfficientNet推理（左圖）和訓(xùn)練（右圖）模型測試中，IPU在比GPU延遲低14倍的情況下實現(xiàn)了15倍的高吞吐量的優(yōu)勢，推理模型種子能夠?qū)崿F(xiàn)7倍于目前GPU解決方案的吞吐量。

如下圖所示，ResNeXt-101: Inference（左圖）和 ResNeXt-50 Training（右圖）與GPU相比，Graphcore C2 IPU處理器在延遲低24倍的情況下實現(xiàn)了7倍的高吞吐量。

好馬配好鞍——IPU全軟件棧和框架支持

Graphcore提供了Poplar SDK IPU軟件開發(fā)平臺，幫助用戶高效地構(gòu)建人工智能應(yīng)用，可為當(dāng)今的領(lǐng)先模型提供開箱即用的先進(jìn)性能。

Poplar SDK可與TensorFlow、Pytorch和ONNX等流行框架一起使用。它支持高階的機器智能圖描述，可編譯加載到IPU上優(yōu)化的Poplar圖和相關(guān)的控制程序。大規(guī)模的處理器內(nèi)存意味著可以充分利用龐大的處理器內(nèi)帶寬，可將整個模型加載到IPU上。

Poplar SDK支持一系列標(biāo)準(zhǔn)框架。通過TensorFlow，Poplar SDK可直接接受XLA圖，并將XLA編譯輸出為Poplar圖和控制程序。

Graphcore還為ONNX提供了訓(xùn)練運行時（runtime），并且正與ONNX各組織緊密合作，以將其納入ONNX標(biāo)準(zhǔn)環(huán)境中。

DSS 8440服務(wù)器：業(yè)界首款采用Graphcore技術(shù)的機器學(xué)習(xí)服務(wù)器

作為Graphcore的合作伙伴，戴爾科技希望能為用戶提供更強大的算力支持，將業(yè)內(nèi)領(lǐng)先的創(chuàng)新研發(fā)成果融入機器學(xué)習(xí)硬件產(chǎn)品，推出了業(yè)界首款搭載Graphcore IPU的戴爾易安信DSS 8440服務(wù)器。它屬于兩處理器插槽的4U服務(wù)器，旨在為人工智能應(yīng)用提供卓越的性能。

支持8個Graphcore C2卡（雙IPU），可提供高達(dá)1.6Peta FLOP的混合精度機器智能計算能力。

采用了多功能平衡加速器，可以搭載4個、8個或10個NVIDIA Tesla V100 GPUs以及更高達(dá)16塊T4 GPUs，用戶可以根據(jù)需要和最佳配置，有效地分配機器學(xué)習(xí)資源。

擁有高速輸入/輸出性能，利用IPU-Link的“階梯式”拓?fù)洌趦蓚€IPU C2卡之間的總體雙向帶寬為256GB/s。此配置保障了多塊IPU卡之間高速共享模型參數(shù)或數(shù)據(jù)，為科學(xué)和工程環(huán)境中的建模、模擬和預(yù)測分析等計算密集型工作負(fù)載提供更優(yōu)性能。

對于分布式訓(xùn)練應(yīng)用，戴爾易安信DSS 8440服務(wù)器還提供多個100Gbps網(wǎng)絡(luò)鏈接，以實現(xiàn)服務(wù)器到服務(wù)器的可擴展性。

搭載了Graphcore IPU的戴爾易安信DSS 8440服務(wù)器，是人工智能訓(xùn)練和推理應(yīng)用的理想之選。用戶利用DSS 8440中大量的低延遲本地存儲和強大的吞吐能力，可從海量的數(shù)據(jù)源中獲得更快的結(jié)果。

戴爾易安信豐富的機器學(xué)習(xí)專業(yè)知識，經(jīng)典機器學(xué)習(xí)、深度學(xué)習(xí)的硬件和解決方案，能夠幫助AI 技術(shù)開發(fā)、研發(fā)型的初創(chuàng)小企業(yè)，快速部署穩(wěn)定可靠且高算力的基礎(chǔ)架構(gòu)產(chǎn)品，支持創(chuàng)新研發(fā)提高其核心競爭力。

尊敬的讀者

隨著2021新年的到來

戴爾科技開年第一“惠”盛情來襲

助企業(yè)新的一年牛氣沖天！

多款服務(wù)器、工作站、商用筆記本

等產(chǎn)品限時優(yōu)惠

更有0元試用、現(xiàn)金紅包

等活動等你來參與

快來掃描下方二維碼

或點擊文末閱讀原文

了解活動詳情

相關(guān)內(nèi)容推薦：戴爾科技開年第一“惠”盛情來襲|爆款服務(wù)器“骨折價”限時搶購

責(zé)任編輯：張燕妮來源：戴爾科技集團(tuán)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<button id="xz8ln"><b id="xz8ln"></b></button>