星云智聯(lián)發(fā)布S1400系列高速互聯(lián)方案,深度適配 DeepSeek,顯著提升AI計(jì)算集群通信效率!
6月3日,星云智聯(lián)宣布在AI智算網(wǎng)絡(luò)領(lǐng)域?qū)崿F(xiàn)關(guān)鍵技術(shù)突破,正式推出S1400系列AI智算高速互聯(lián)網(wǎng)卡。作為完全自主研發(fā)的國產(chǎn)化解決方案,該產(chǎn)品針對(duì)大模型訓(xùn)練與推理場(chǎng)景的嚴(yán)苛需求,以突破性網(wǎng)絡(luò)性能重新定義智算集群互聯(lián)標(biāo)準(zhǔn)。 目前,產(chǎn)品已成功適配DeepSeek的DeepEP開源通信庫,顯著提升AI計(jì)算集群的通信效率,為AI應(yīng)用創(chuàng)新注入強(qiáng)勁動(dòng)力。
S1400系列AI智算高速互聯(lián)網(wǎng)卡具備1x400G或2x200G的網(wǎng)絡(luò)接口模式,采用PCIe Gen 5.0 x16接口,提供高達(dá)雙向100Mpps的RDMA消息速率。其關(guān)鍵特性包括:全面支持RoCEv2協(xié)議標(biāo)準(zhǔn),并兼容NCCL、DeepEP,BCCL等主流集合通信庫,確保與現(xiàn)有AI生態(tài)的無縫對(duì)接。另外,S1400支持先進(jìn)的GPUDirect技術(shù)(GDR、GDA)、用戶態(tài)MR(UMR)操作,為大規(guī)模AI計(jì)算集群提供了極致的低延遲和高帶寬。尤為突出的是,S1400系列AI智算高速互聯(lián)網(wǎng)卡自研NBL-SRP協(xié)議支持對(duì)所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的亂序接收和選擇性重傳,并針對(duì)GPU側(cè)Atomic操作和低延遲Local read進(jìn)行了特別優(yōu)化,這些特性進(jìn)一步彌補(bǔ)了國內(nèi)生態(tài)在此方面的不足。S1400系列AI智算高速互聯(lián)網(wǎng)卡大幅優(yōu)化了數(shù)據(jù)處理流程,顯著提升了AI智算場(chǎng)景下的互聯(lián)效率。
在擁塞控制方面,S1400系列搭載了星云智聯(lián)自研的NBL-CC算法。該算法基于RTT探測(cè)與丟包統(tǒng)計(jì)進(jìn)行主動(dòng)的端到端擁塞控制,不依賴交換機(jī)特定配置,具有參數(shù)少、部署便捷、性能優(yōu)異的特點(diǎn),能實(shí)現(xiàn)快速啟動(dòng)、快速收斂,并保持交換機(jī)低隊(duì)列深度與高吞吐量。實(shí)際測(cè)試數(shù)據(jù)顯示,NBL-CC相較于傳統(tǒng)的DCQCN算法,在平均性能上提升50%,99分位性能提升48%,尤其在短流場(chǎng)景下提升幅度高達(dá)60%-100%,有效保障了網(wǎng)絡(luò)的低隊(duì)列擁塞和持續(xù)高吞吐。配合自研的NBL-SRP協(xié)議(逐包多路徑、DDP亂序接收、選擇性重傳、快速重傳),S1400系列AI智算高速互聯(lián)網(wǎng)卡在AI主流場(chǎng)景及有損網(wǎng)絡(luò)下都能夠充分發(fā)揮接口帶寬潛力,其NCCL通信性能在多個(gè)關(guān)鍵指標(biāo)上展現(xiàn)出持平并且部分超越業(yè)界標(biāo)桿產(chǎn)品,并在特定業(yè)務(wù)場(chǎng)景時(shí)延測(cè)試中表現(xiàn)出與國際頂尖產(chǎn)品相媲美的168us優(yōu)異數(shù)據(jù)(GDR write 7M + atomic),展現(xiàn)了強(qiáng)大的市場(chǎng)競(jìng)爭(zhēng)力。
在全球科技競(jìng)爭(zhēng)加劇的背景下,星云智聯(lián)S1400系列產(chǎn)品的發(fā)布不僅是國產(chǎn)高端網(wǎng)絡(luò)技術(shù)的突破,更展現(xiàn)了中國企業(yè)在AI基礎(chǔ)設(shè)施領(lǐng)域的自主創(chuàng)新能力。通過持續(xù)攻克自研芯片與算法關(guān)鍵技術(shù),S1400系列產(chǎn)品的發(fā)布標(biāo)志著我國在AI基礎(chǔ)設(shè)施領(lǐng)域已具備與國際領(lǐng)先水平同臺(tái)競(jìng)技的實(shí)力,為構(gòu)建自主可控的AI產(chǎn)業(yè)生態(tài)鏈提供了關(guān)鍵網(wǎng)絡(luò)支撐。 星云智聯(lián)將堅(jiān)定不移地加大研發(fā)投入,推動(dòng)國產(chǎn)AI算力網(wǎng)絡(luò)的技術(shù)進(jìn)步,助力客戶把握人工智能時(shí)代的戰(zhàn)略機(jī)遇,決勝未來。