降低人工智能成本50% 阿里云推出新一代異構(gòu)實(shí)例GN5i
9月12日,阿里云正式推出***一代GPU實(shí)例GN5i。這款產(chǎn)品主要適用于深度學(xué)習(xí)的在線推理(Inference)階段,可一鍵部署TensorFlow等主流深度學(xué)習(xí)框架,提供智能調(diào)度、自動(dòng)運(yùn)維、實(shí)時(shí)擴(kuò)容等服務(wù)。人工智能產(chǎn)業(yè)用戶可通過GN5i搭建微秒級(jí)響應(yīng)的AI服務(wù),在線服務(wù)成本減少50%以上。
阿里云官網(wǎng)顯示,GN5i采用了英偉達(dá)Pascal架構(gòu)P4圖形處理器,提供***45Tops INT8整型計(jì)算能力和11TFlops FP32單精度浮點(diǎn)計(jì)算能力,在滿足數(shù)據(jù)處理吞吐的基礎(chǔ)上,時(shí)延***可達(dá)微秒級(jí)。支持小時(shí)付費(fèi),也支持包月包年。
此外,針對(duì)自建GPU服務(wù)器經(jīng)常會(huì)遇到的擴(kuò)容難、適配難的問題,GN5i規(guī)格族提供了靈活彈性的系列化配置,可以根據(jù)深度學(xué)習(xí)計(jì)算力的要求,按需選擇合適的規(guī)格,分鐘級(jí)即可完成實(shí)例的創(chuàng)建,并可根據(jù)運(yùn)算力需求進(jìn)行GPU實(shí)例的“Scale-out”水平擴(kuò)容或“Scale-up”垂直變配。
阿里云高級(jí)技術(shù)專家龍欣介紹,在面向AI深度學(xué)習(xí)在線推理場(chǎng)景時(shí),GN5i實(shí)例能夠給客戶帶來以下價(jià)值:
· 穩(wěn)定的企業(yè)級(jí)GPU計(jì)算能力,保障深度學(xué)習(xí)推理任務(wù)處理效率;
· 全面兼容主流深度學(xué)習(xí)框架,如TensorFlow、Caffe、MXNet、CNTK等;
· 配備阿里云高性能SSD云存儲(chǔ),加速數(shù)據(jù)的讀取性能;搭配阿里云的OSS存儲(chǔ)服務(wù),能達(dá)到***的存儲(chǔ)性價(jià)比;
· 在滿足數(shù)據(jù)處理吞吐的基礎(chǔ)上,時(shí)延***可達(dá)微秒級(jí);
· 推理型專用GPU,大幅降低AI在線服務(wù)建設(shè)成本;
· GN5i的推出進(jìn)一步豐富了阿里云異構(gòu)計(jì)算家族的產(chǎn)品線。針對(duì)模型訓(xùn)練學(xué)習(xí),阿里云在今年5月推出了高性能GPU實(shí)例GN5,單實(shí)例最多可提供8個(gè)英偉達(dá) P100 GPU、2萬多個(gè)并行處理核心,***75TFLOPS FP32單精度浮點(diǎn)、150 TFLOPS FP16半精度浮點(diǎn)和37 TFLOPS FP64雙精度浮點(diǎn)運(yùn)算能力,每個(gè)P100搭配的16GB HBM2 3D堆疊內(nèi)存提供了高達(dá)732GB每秒的數(shù)據(jù)傳輸速率,配合GN5i可有效保障深度學(xué)習(xí)的處理效率。
除了產(chǎn)品層面,阿里云還提供了全方位的人工智能產(chǎn)業(yè)服務(wù),包括智能語音交互、圖像/視頻識(shí)別、交通預(yù)測(cè)、情感分析等技術(shù)服務(wù),這些技術(shù)正通過阿里云ET對(duì)外輸出。過去一年,阿里云推出ET城市大腦、ET工業(yè)大腦、ET醫(yī)療大腦等行業(yè)垂直的人工智能系統(tǒng),為工廠或者醫(yī)院創(chuàng)造更多利潤(rùn)或者更高的診斷準(zhǔn)確率。

















 
 
 



 
 
 
 