偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

英偉達(dá)25年路線圖驚爆流出!老黃豪賭B100暴打AMD,秘密武器X100曝光

人工智能 新聞
近日,外媒曝光了一份英偉達(dá)全新GPU路線圖,史上最強(qiáng)B100技術(shù)細(xì)節(jié)全流出,其中最神秘的X100,據(jù)悉將在2025年上市。

英偉達(dá)的AI硬件霸主,當(dāng)?shù)锰昧耍?/span>

現(xiàn)在,各大科技公司都在虎視眈眈,等著一舉顛覆它的霸主之位。

當(dāng)然,英偉達(dá)也不會坐以待斃。

最近,外媒SemiAnalysis曝出了一份英偉達(dá)未來幾年的硬件路線圖,包括萬眾矚目的H200、B100和「X100」GPU。

隨之一同流出的,還有一些硬核信息,包括英偉達(dá)的工藝技術(shù)計劃、HBM3E的速度/容量、PCIe 6.0、PCIe 7.0、NVLink、1.6T 224G SerDes計劃。

如果這些計劃如愿成功,英偉達(dá)將繼續(xù)成功碾壓對手。

當(dāng)然,霸主之位也沒這么好當(dāng)——AMD的MI300、MI400,亞馬遜的Trainium2,微軟的Athena,英特爾的Gaudi 3,都不會讓英偉達(dá)好過。

準(zhǔn)備好,前方高能來襲!

英偉達(dá),不止想做硬件霸主

谷歌早已開始布局自己的AI基礎(chǔ)設(shè)施,他們構(gòu)建的TPUv5和TPUv5e,既可以用于內(nèi)部的訓(xùn)練和推理,也可以給蘋果、Anthropic、CharacterAI、MidJourney等外部客戶使用。

谷歌不是英偉達(dá)唯一的威脅。

在軟件方面,Meta的PyTorch2.0和OpenAI的Triton也在迅猛發(fā)展,使其他硬件供應(yīng)商得以實現(xiàn)兼容。

現(xiàn)在,軟件上的差距仍然存在,但遠(yuǎn)不及從前那么巨大了。

在軟件堆棧上,AMD的GPU、英特爾的Gaudi、Meta的MTIA和微軟的Athena都取得了一定程度的發(fā)展。

盡管英偉達(dá)仍然保持著硬件領(lǐng)先地位,但差距的縮小,會越來越快。

英偉達(dá)H100,也不會獨(dú)領(lǐng)風(fēng)騷太久。

在接下來的幾個月內(nèi),無論是AMD的MI300,還是英特爾的Gaudi 3,都將推出技術(shù)上優(yōu)于H100的硬件產(chǎn)品。

而除了谷歌、AMD、英特爾這些難纏的對手,還有一些公司,也給了英偉達(dá)不小的壓力。

這些公司雖然在硬件設(shè)計上暫時落后,但能得到背后巨頭的補(bǔ)貼——天下苦英偉達(dá)久矣,這些公司都希望打破英偉達(dá)在HBM上的巨額利潤壟斷。

亞馬遜即將推出的Trainium2和Inferentia3, 微軟即將推出的Athena,都是已布局多年的投資。

競爭對手來勢洶洶,英偉達(dá)當(dāng)然也不會坐以待斃。

在外媒SemiAnalysis看來,無論管理風(fēng)格還是路線決策,英偉達(dá)都是「行業(yè)中最多疑的公司之一」。

而黃仁勛身上,體現(xiàn)了一股安迪·格魯夫的精神。

成功導(dǎo)致自滿。自滿導(dǎo)致失敗。只有偏執(zhí)狂才能生存。

為了穩(wěn)坐第一把交椅,英偉達(dá)野心勃勃,采取了多管齊下的冒險策略。

他們已經(jīng)不屑于再和英特爾、AMD在傳統(tǒng)的市場上競爭,而是想成為谷歌、微軟、亞馬遜、Meta、蘋果這樣的科技巨頭。

圖片

而英偉達(dá)的DGX Cloud、軟件,以及針對非半導(dǎo)體領(lǐng)域的收購策略,背后都是一盤大棋。

路線圖最新細(xì)節(jié)曝光!

英偉達(dá)最新路線圖的重要細(xì)節(jié),已經(jīng)被曝光。

內(nèi)容包括所采用的網(wǎng)絡(luò)、內(nèi)存、封裝和工藝節(jié)點(diǎn),各種GPU、SerDes選擇、PCIe6.0、協(xié)同封裝光學(xué)器件和光路交換機(jī)等細(xì)節(jié)。

顯然,懾于谷歌、亞馬遜、微軟、AMD和英特爾的競爭壓力,英偉達(dá)連夜加快了B100「X100」的研發(fā)。

B100:上市時間高于一切

根據(jù)內(nèi)部消息,英偉達(dá)的B100將于2024年第三季度量產(chǎn),部分早期樣品將于2024年第二季度出貨。

從性能和TCO看,無論是亞馬遜的Trainium2、谷歌的TPUv5、AMD的MI300X,還是英特爾的Gaudi 3或微軟的Athena,跟它相比都弱爆了。

即使考慮到從設(shè)計合作方、AMD或臺積電獲得的補(bǔ)貼,它們也統(tǒng)統(tǒng)打不過。

為了盡快將B100推向市場,英偉達(dá)做了不少妥協(xié)。

比如,英偉達(dá)本想把功耗定在更高的水平(1000W),但最終,他們還是選擇了繼續(xù)使用H100的700W。

這樣,B100推出時,就能繼續(xù)使用風(fēng)冷技術(shù)。

此外,在B100早期系列,英偉達(dá)也會堅持使用PCIe5.0。

5.0和700W的組合意味著,它可以直接插入現(xiàn)有的H100 HGX服務(wù)器中,從而大大提高供應(yīng)鏈能力,更早地量產(chǎn)和出貨。

之所以決定堅持使用5.0,還有部分原因是,AMD和英特爾在PCIe6.0集成上還遠(yuǎn)遠(yuǎn)落后。而即使英偉達(dá)自己的內(nèi)部團(tuán)隊,也沒有準(zhǔn)備好使用PCIe6.0CPU。

此外,他們還將使用速度更快的C2C式鏈接。

圖片

在以后,ConnectX-8會配備一款集成的PCIe6.0交換機(jī),但目前還沒人準(zhǔn)備好。

據(jù)悉,博通和AsteraLabs要到年底才能準(zhǔn)備好量產(chǎn)的PCIe6.0重定時器,而考慮到這些基板的尺寸,所需的重定時器只會更多。

這也意味著,最初的B100將被限制在3.2T,使用ConnectX-7時的速度也僅僅是400G,而非英偉達(dá)在PPT上所宣稱的每個GPU 800G。

如果保持空氣冷卻,電源、PCIe和網(wǎng)絡(luò)速度不變,那無論是制造還是部署,都會很容易。

圖片

稍后,英偉達(dá)會推出一個需要水冷的1,000W+版本B100。

這一版B100將通過ConnectX-8,為每個GPU提供完整的800G網(wǎng)絡(luò)連接。

對于以太網(wǎng)/InfiniBand,這些SerDes仍然是8x100G。

雖然每個GPU的網(wǎng)絡(luò)速度提高了一倍,但基數(shù)卻減半了,因為它們?nèi)孕柰ㄟ^相同的51.2T交換機(jī)。而102.4T交換機(jī),在B100一代中將不再使用。

有趣的是,有爆料稱B100上的NVLink組件將采用224G SerDes,如果英偉達(dá)真能做到這一點(diǎn),無疑是巨大的進(jìn)步。

大多數(shù)人業(yè)內(nèi)人士都認(rèn)為,224G并不可靠,2024年不可能實現(xiàn),但英偉達(dá)的人除外。

要知道,無論是谷歌、Meta,還是亞馬遜,他們的224G AI加速器量產(chǎn)目標(biāo)都定在2026/2027年。

如果英偉達(dá)在2024/2025年就實現(xiàn)了這一點(diǎn),鐵定會把對手們打得落花流水。

圖片

據(jù)悉,B100仍然是臺積電的N4P,而不是基于3nm工藝的技術(shù)。

顯然,對于如此大的芯片尺寸,臺積電的3nm工藝尚未成熟。

圖片

根據(jù)英偉達(dá)基板供應(yīng)商Ibiden透露的基板尺寸,英偉達(dá)似乎已經(jīng)轉(zhuǎn)而采用由2個單片大芯片MCM組成的設(shè)計,包含8或12個HBM堆疊。

SambaNova和英特爾明年的芯片,都采用了類似的宏觀設(shè)計。

圖片

英偉達(dá)之所以沒有像AMD那樣使用混合鍵合技術(shù),是因為他們需要量產(chǎn),而成本就是他們的一大顧慮。

據(jù)SemiAnalysis估測,這兩款B100芯片的內(nèi)存容量將與AMD的MI300X相近或更高,達(dá)到24GB堆疊。

風(fēng)冷版B100的速度可達(dá)6.4Gbps,而液冷版可能高達(dá)9.2Gbps。

另外,英偉達(dá)還在路線圖中展示了GB200和B40。

GB200和GX200都使用了G,顯然這是一個占位符,因為英偉達(dá)將推出基于Arm架構(gòu)的新CPU。并不會長期使用Grace。

B40很可能只是B100的一半,只有一個單片N4P芯片,和最多4或6層的HBM。與L40S不同,這對于小模型的推理是很有意義的。

「X100」:致命一擊

曝出的路線圖中最惹人注意的,就是英偉達(dá)的「X100」時間表了。

有趣的是,它與AMD目前的MI400時間表完全吻合。就在H100推出一年后,AMD發(fā)布了MI300X戰(zhàn)略。

AMD給MI300X的封裝令人印象深刻,他們大量塞入了更多的計算和內(nèi)存,希望能超越一年前的H100,從而在純硬件上超越英偉達(dá)。

英偉達(dá)也發(fā)現(xiàn)了,他們兩年一次發(fā)布新GPU的節(jié)奏,給了競爭對手大好的機(jī)會搶奪市場。

被逼急了的英偉達(dá),正在把產(chǎn)品周期加快到每年一次,不給對手任何機(jī)會。比如,他們計劃于2025年推出「X100」,僅僅比B100晚一年。

當(dāng)然,「X100」目前還并未量產(chǎn)(不像B100),所以一切還懸而未決。

要知道,在過去,英偉達(dá)可從來不會討論下一代產(chǎn)品之后的產(chǎn)品,這次已經(jīng)是史無前例了。

而且,名字大概率也不叫「X100」。

英偉達(dá)一直以來的傳統(tǒng),都是以Ada Lovelace、Grace Hopper和Elizabeth Blackwell等杰出女科學(xué)家的名字來命名GPU的。

至于「X」,唯一符合邏輯的就是研究半導(dǎo)體和金屬帶結(jié)構(gòu)的Xie Xide,但考慮到她的身份,概率應(yīng)該不大。

圖片

供應(yīng)鏈大師:老黃的豪賭

自英偉達(dá)成立之初,黃仁勛就一直在積極推動著對供應(yīng)鏈的掌握,從而支持龐大的增長目標(biāo)。

他們不僅愿意承擔(dān)不可取消的訂單——高達(dá)111.5億美元的采購、產(chǎn)能和庫存承諾,并且還有38.1億美元的預(yù)付款協(xié)議。

可以說,沒有一家供應(yīng)商能與之相提并論。

而英偉達(dá)的事跡也不止一次表明,他們可以在供應(yīng)短缺時創(chuàng)造性地增加供應(yīng)量。

2007年黃仁勛與張忠謀的對話

1997年,張忠謀和我相遇時,只有100人的英偉達(dá)在那一年完成了2700萬美元的收入。

你們可能不相信,但張忠謀以前經(jīng)常打電話推銷,并且還會上門拜訪。而我則會向張忠謀解釋英偉達(dá)是做什么的,以及我們的芯片尺寸需要多大,而且每年都會越來越大。

后來,英偉達(dá)總共做了1.27億個晶圓。從那時起,英偉達(dá)每年增長近100%,直到現(xiàn)在。也就是在過去10年中,復(fù)合年增長率達(dá)到了70%左右。

當(dāng)時,張忠謀無法相信英偉達(dá)需要如此多的晶圓,但黃仁勛堅持了下來。

英偉達(dá)通過在供應(yīng)方面的大膽嘗試,取得了巨大成功。雖然時不時要減記價值數(shù)十億美元的庫存,但他們?nèi)匀粡倪^度的訂購中獲得了正收益。

這次,英偉達(dá)直接搶占了GPU上游組件的大部分供應(yīng)——

他們向SK海力士、三星和美光這3家HBM供應(yīng)商下了非常大的訂單,擠占了除博通和Google之外其他所有人的供應(yīng)。同時,還買下了臺積電CoWoS的大部分供應(yīng),以及Amkor的產(chǎn)能。

此外,英偉達(dá)還充分利用了HGX板卡和服務(wù)器所需的下游組件,如重定時器、DSP、光學(xué)器件等。

如果供應(yīng)商對英偉達(dá)要求置若罔聞,那么就會面對老黃的「蘿卜加大棒」——

一方面,他們會從英偉達(dá)獲得難以想象的訂單;另一方面,他們可能會被英偉達(dá)從現(xiàn)有的供應(yīng)鏈中剔除。

當(dāng)然,英偉達(dá)也只有在供應(yīng)商至關(guān)重要且無法被淘汰或多元化供應(yīng)的情況下,才會使用承諾和不可取消的訂單。

圖片

每個供應(yīng)商似乎都認(rèn)為自己是AI的贏家,部分原因是因為英偉達(dá)向所有供應(yīng)商都下了大量的訂單,而他們也都認(rèn)為自己贏得了大部分業(yè)務(wù)。但實際上,只是因為英偉達(dá)的增長速度太快了。

回到市場動態(tài)上,雖然英偉達(dá)的目標(biāo)是在明年實現(xiàn)超過700億美元的數(shù)據(jù)中心銷售額,但只有谷歌在上游有足夠的產(chǎn)能——擁有超過100萬臺的設(shè)備。AMD在AI領(lǐng)域的總產(chǎn)能仍然非常有限,最高也不過幾十萬臺。

商業(yè)策略:潛在的反競爭

眾所周知,英偉達(dá)正在利用對GPU的巨大需求,來向客戶推銷和交叉銷售產(chǎn)品。

供應(yīng)鏈中有大量信息透露,英偉達(dá)會根據(jù)一系列因素向某些公司提供優(yōu)先分配。包括但不限于:多元化采購計劃、自主研發(fā)AI芯片計劃、購買英偉達(dá)的DGX、NIC、交換機(jī)和/或光學(xué)設(shè)備等。

事實上,英偉達(dá)的捆綁銷售非常成功。盡管之前只是一家規(guī)模很小的光纖收發(fā)器供應(yīng)商,但他們的業(yè)務(wù)量在一個季度內(nèi)增長了兩倍,預(yù)計明年的出貨量將超過10億美元——遠(yuǎn)遠(yuǎn)超過了自家GPU或網(wǎng)絡(luò)芯片業(yè)務(wù)的增長速度。

這些策略,可以說是相當(dāng)周密。

比如,想要在英偉達(dá)的系統(tǒng)上實現(xiàn)3.2T網(wǎng)絡(luò)和可靠的RDMA/RoCE,唯一方法就是使用英偉達(dá)的NIC。當(dāng)然,一方面也是因為英特爾、AMD和博通的產(chǎn)品實在是缺乏競爭力——仍然停留在200G的水平上。

而通過對供應(yīng)鏈的管理,英偉達(dá)還促使400G InfiniBand NIC的交付周期,能夠比400G以太網(wǎng)NIC明顯縮短。而這兩種NIC(ConnectX-7)在芯片和電路板設(shè)計上,其實是完全相同的。

其原因在于英偉達(dá)的SKU配置,而非實際的供應(yīng)鏈瓶頸——迫使企業(yè)不得不購買成本更高的InfiniBand交換機(jī),而不是標(biāo)準(zhǔn)的以太網(wǎng)交換機(jī)。

這還不止,看看供應(yīng)鏈對L40和L40S GPU有多么著迷,就知道英偉達(dá)又在分配上做手腳了——為了贏得更多H100的分配,OEM廠商就需要購買更多的L40S。

這與英偉達(dá)在PC領(lǐng)域的操作,也是如出一轍——筆記本制造商和AIB合作伙伴必須購買更大量的G106/G107(中/低端GPU)才能獲得更稀缺、更高利潤的G102/G104(高端和旗艦GPU)。

作為配合,供應(yīng)鏈中的人也被灌輸了這樣的說法——L40S比A100更好,因為它具有更高的FLOPS。

但實際上,這些GPU并不適合LLM推理,因為它們的顯存帶寬還不到A100的一半,而且也沒有NVLink。

這意味著在L40S上運(yùn)行LLM并實現(xiàn)良好的TCO幾乎是不可能的,除非是非常小的模型。而大批量的處理也會導(dǎo)致分配到每個用戶上的token/s幾乎是不可用的,從而使理論上的FLOPS在實際應(yīng)用中變得毫無用處。

此外,英偉達(dá)的MGX模塊化平臺,雖然省去了服務(wù)器設(shè)計的艱苦工作,但也同時降低了OEM的利潤率。

戴爾、惠普和聯(lián)想等公司顯然對MGX持抵制態(tài)度,但諸如超微、廣達(dá)、華碩、技嘉等公司則爭相填補(bǔ)這一空白,將低成本的「企業(yè)人工智能」商品化。

而這些參與L40S和MGX炒作的OEM/ODM,也可以從英偉達(dá)那里獲得更好的主線GPU產(chǎn)品分配。

光電共封裝(Co-Packaged Optics)

在CPO方面,英偉達(dá)也是相當(dāng)重視。

他們一直在研究各種解決方案,包括來自Ayar Labs的解決方案,以及他們自己從Global Foundries和臺積電獲得的解決方案。

目前,英偉達(dá)已經(jīng)考察了幾家初創(chuàng)公司的CPO方案,但暫時還沒有做出最終的決定。

分析認(rèn)為,英偉達(dá)很有可能將CPO集成到「X100」的NVSwitch上。

因為直接集成到GPU本身可能成本太高,而且在可靠性方面也很困難。

光路交換機(jī)(Optical Circuit Switch)

谷歌在人工智能基礎(chǔ)設(shè)施方面最大的優(yōu)勢之一,就是它的光路交換機(jī)。

顯然,英偉達(dá)也在追求類似的東西。目前,他們已經(jīng)接觸了多家公司,希望能夠進(jìn)行合作開發(fā)。

英偉達(dá)意識到,F(xiàn)at Tree在繼續(xù)擴(kuò)展方面已經(jīng)走到了盡頭,因此需要另一種拓?fù)浣Y(jié)構(gòu)。

與谷歌選擇6D Torus不同,英偉達(dá)更傾向于采用Dragonfly結(jié)構(gòu)。

據(jù)了解,英偉達(dá)距離OCS的出貨還遙遙無期,但他們希望在2025年時能夠更加接近這一目標(biāo),但大概率無法實現(xiàn)。

OCS + CPO是圣杯,尤其是當(dāng)OCS可以實現(xiàn)按數(shù)據(jù)包交換時,將會直接改變游戲規(guī)則。

不過,目前還沒有人展示過這種能力,甚至連谷歌也沒有。

雖然英偉達(dá)的OCS和CPO還只是研究部門的兩套PPT,但分析人士認(rèn)為,CPO會在2025至2026年內(nèi)離產(chǎn)品化更進(jìn)一步。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-02-24 13:59:43

AI機(jī)器人

2012-11-06 09:28:40

AMD壓路機(jī)打樁機(jī)

2011-08-04 10:34:48

ASP.NET MVC

2024-07-08 08:06:00

2012-02-22 16:44:44

Flash

2013-01-09 09:44:42

AMDAPU路線圖

2009-04-24 15:20:07

微軟合作伙伴Windows 7渠道合作

2009-03-16 11:03:53

Symbian開源開發(fā)平臺

2014-05-06 17:30:09

2023-06-14 12:08:51

2013-04-18 10:25:29

路線圖AMD壓路機(jī)

2025-03-21 09:46:50

2024-06-03 12:00:23

2025-08-20 09:28:53

2023-08-14 08:07:46

ChatGPTAI

2013-10-16 09:28:14

亞馬遜AWSSDN

2013-06-24 10:01:23

AMD服務(wù)器

2013-09-10 16:02:46

AMD嵌入式

2012-03-21 14:52:40

微軟Dynamics云計算
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號