AI芯片創(chuàng)業(yè)公司們走到分岔口
本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請(qǐng)至雷鋒網(wǎng)官網(wǎng)申請(qǐng)授權(quán)。
距離2016年左右的AI芯片創(chuàng)業(yè)熱潮已經(jīng)過(guò)去五年多,從團(tuán)隊(duì)組建,到芯片設(shè)計(jì)、再到產(chǎn)品落地,AI芯片公司們到了交出一份答卷的時(shí)間。
Graphcore大中華區(qū)總裁兼全球首席營(yíng)收官盧濤
Graphcore大中華區(qū)總裁兼全球首席營(yíng)收官盧濤對(duì)雷峰網(wǎng)表示,“2022年AI芯片公司的競(jìng)爭(zhēng)會(huì)更加激烈,因?yàn)椴煌墓具x擇了不同的策略和路徑,今年開始能看得更加清晰?!?/strong>
實(shí)際上,從2020年開始,大部分AI芯片公司都開啟了芯片的落地,然而由于AI芯片與傳統(tǒng)芯片有明顯的差別,芯片提供者與使用者之間的認(rèn)知差異,加上疫情的影響,和全球蔓延的缺芯潮,AI芯片的落地和大規(guī)模使用面臨重重挑戰(zhàn)。
2021年,業(yè)界更加關(guān)注AI的部署,包括對(duì)機(jī)器學(xué)習(xí)框架的關(guān)注,支持的模型,以及集群的管理和調(diào)度管理。
想要成為AI芯片的佼佼者,有哪三個(gè)秘訣?
AI芯片公司面前的七個(gè)臺(tái)階
AI熱潮催生了大量的芯片初創(chuàng)公司,初創(chuàng)公司要成功落地全新類型的AI芯片,挑戰(zhàn)當(dāng)前巨頭,可以以攀登珠穆朗瑪峰來(lái)比喻。
盧濤認(rèn)為,如果今天的巨頭在珠穆朗瑪峰上,想要達(dá)到巨頭的高度,需要攀登七個(gè)臺(tái)階。
第一個(gè)臺(tái)階是組建團(tuán)隊(duì),第二個(gè)臺(tái)階是宣講理念,第三個(gè)臺(tái)階是設(shè)計(jì)出芯片,第四個(gè)臺(tái)階是有芯片且能給客戶送樣品做測(cè)試,第五個(gè)臺(tái)階是有產(chǎn)品有落地,第六個(gè)臺(tái)階是有產(chǎn)品,有很多落地的,第七個(gè)臺(tái)階是有很大的市場(chǎng)份額。盧濤認(rèn)為Graphcore處于第五到第六個(gè)臺(tái)階間。
處于這個(gè)階段的公司,表明其已經(jīng)解決了許多技術(shù)挑戰(zhàn)。AI計(jì)算與傳統(tǒng)的CPU有顯著的差別,過(guò)去5-10年間,CPU的應(yīng)用都十分明確,比如Web服務(wù)、數(shù)據(jù)庫(kù)服務(wù)、存儲(chǔ)服務(wù)等。但AI整體面向的應(yīng)用有許多創(chuàng)新和研究,整體呈高度動(dòng)態(tài)化。
在這樣的情況下,AI芯片的落地更顯艱難,步驟大致可以分為三個(gè),首先,要用AI芯片的性能優(yōu)勢(shì)吸引客戶,接下來(lái)客戶會(huì)考慮軟件移植的難度以及時(shí)間,在歷經(jīng)驗(yàn)證之后,才能實(shí)現(xiàn)大規(guī)模部署。
這個(gè)過(guò)程可以說(shuō)是漫長(zhǎng)而又挑戰(zhàn)重重。其中一個(gè)非常大的挑戰(zhàn)就是AI芯片提供者和使用者之間認(rèn)知的差異。“從我們的角度而言,雖然這種認(rèn)知的差異有所改善,但挑戰(zhàn)仍然持續(xù)存在?!北R濤說(shuō),“比如,不少用戶可能覺(jué)得我們的IPU性能表現(xiàn)好,并想能在不修改代碼的情況下遷移到IPU,這就需要我們?cè)谲浖蜕鷳B(tài)方面做大量的工作。”
AI軟件和生態(tài)的建設(shè),要求對(duì)某個(gè)具體的應(yīng)用領(lǐng)域有比較完整的認(rèn)知,實(shí)現(xiàn)整個(gè)業(yè)務(wù)端到端的配合,不僅僅是AI,還包括AI芯片與其它設(shè)備、系統(tǒng)的配合,運(yùn)維管理等。
盧濤指出,“作為計(jì)算平臺(tái)的提供者,要讓最終用戶把我們的平臺(tái)用好,生態(tài)非常重要,生態(tài)建設(shè)能夠降低用戶的使用門檻。同時(shí),垂直案例也非常重要,通過(guò)‘打樣板’,能夠顯著加速在某一行業(yè)的應(yīng)用。當(dāng)然,加強(qiáng)與AI平臺(tái)廠商的合作同樣關(guān)鍵。AI領(lǐng)域有兩種用戶,一種是AI開發(fā)者,有了案例就可以做相應(yīng)的開發(fā),還有一種是AI平臺(tái)型企業(yè),他們可以把AI技術(shù)封裝以提供給其他人員使用?!?/p>
對(duì)于有計(jì)算機(jī)背景的開發(fā)者或研究員,他們可以基于TensorFlow、PyTorch和百度飛槳等進(jìn)行編程,如果不具備這個(gè)能力,就需要借助更高級(jí)的框架,比如Hugging Face來(lái)降低開發(fā)門檻,簡(jiǎn)化開發(fā)。這兩者的開發(fā)難度有顯著差別,如果用PyTorch實(shí)現(xiàn)一個(gè)業(yè)務(wù),可能需要兩百行代碼,但采用Hugging Face,可能用50行代碼就可以完成。
成為AI芯片領(lǐng)先者的三個(gè)關(guān)鍵
不難發(fā)現(xiàn),想要實(shí)現(xiàn)AI芯片的大規(guī)模落地,減小AI芯片提供者和使用者之間的認(rèn)知差是關(guān)鍵,這其中的關(guān)鍵又是軟件和生態(tài)的建設(shè)。
但要成為AI芯片領(lǐng)域的領(lǐng)導(dǎo)者,盧濤認(rèn)為有三個(gè)關(guān)鍵:預(yù)判+冒一點(diǎn)風(fēng)險(xiǎn)+一點(diǎn)運(yùn)氣。
“Graphcore在2016年成立時(shí),只能追趕。對(duì)于新的領(lǐng)域,如果能提前預(yù)判,就可能在領(lǐng)域里具備領(lǐng)先性?!北R濤具體解釋。
2016年,傳統(tǒng)的機(jī)器視覺(jué)模型ResNet已經(jīng)存在,這時(shí)候Graphcore需要追趕,作為追趕者需要做一些預(yù)判發(fā)現(xiàn)機(jī)會(huì)。2020年,Graphcore關(guān)注到了Transformer技術(shù),這種技術(shù)本來(lái)是用于自然語(yǔ)言處理的底層技術(shù),但業(yè)界出現(xiàn)了用Transformer做計(jì)算視覺(jué)的趨勢(shì),Graphcore率先開始支持。
到2021年下半年,一些基于Transformer的視覺(jué)模型,比如ViT成為了熱門。由于有提前的預(yù)判,Graphcore對(duì)于新的基于Transformer的視覺(jué)模型以及GNN都有很好的支持,很多創(chuàng)新和前沿的模型比GPU支持得更好。
正是憑借著創(chuàng)新的IPU硬件和不斷完善的Poplar軟件生態(tài),Graphcore在2021年有不少應(yīng)用案例。在2021年下半年,安捷數(shù)科利用IPU進(jìn)行氣象預(yù)測(cè)、精準(zhǔn)灌溉、防災(zāi)減災(zāi)。深勢(shì)科技完成分子動(dòng)力學(xué)模擬軟件DeePMD-kit向IPU硬件的遷移,探索基于分子動(dòng)力學(xué)模擬的科學(xué)計(jì)算、藥物設(shè)計(jì)、材料設(shè)計(jì)和新型能源等場(chǎng)景。
在金融保險(xiǎn)領(lǐng)域,牛津-英仕曼用IPU進(jìn)行股價(jià)預(yù)測(cè);Tractable與Graphcore達(dá)成合作,加速事故和災(zāi)害恢復(fù)。電信方面,Graphcore與韓國(guó)電信合作發(fā)布了IPU云。在城市環(huán)境可持續(xù)發(fā)展領(lǐng)域,升哲科技基于IPU進(jìn)行城市相關(guān)可持續(xù)發(fā)展方面的應(yīng)用。在醫(yī)療、生命科學(xué)領(lǐng)域,Graphcore與斯坦福大學(xué)醫(yī)學(xué)院合作,使用IPU以“醫(yī)療+隱私計(jì)算”為核心方向進(jìn)行了一些研究和探索。
但這些應(yīng)用案例多為前沿技術(shù)和應(yīng)用的探索,不是大規(guī)模的商業(yè)應(yīng)用。對(duì)此盧濤表示,“商業(yè)領(lǐng)域內(nèi),我們有一些大規(guī)模應(yīng)用的客戶,他們更關(guān)注于自身業(yè)務(wù)給客戶帶來(lái)的價(jià)值,很少和技術(shù)廠商一同發(fā)布新聞。前沿的研究更加開放,研究者也希望結(jié)果能讓更多人看到,自然會(huì)有更多可以分享的案例?!?/p>
他也同時(shí)透露,2022年,Graphcore會(huì)有一些和國(guó)內(nèi)公有云廠商的IPU產(chǎn)品發(fā)布,也會(huì)有新的硬件產(chǎn)品的發(fā)布。Graphcore也會(huì)在一些相關(guān)的AI應(yīng)用領(lǐng)域中會(huì)進(jìn)一步加深合作,比如AI輔助科研、自動(dòng)駕駛等是他們2022年在AI應(yīng)用或垂直領(lǐng)域中比較重要的方向。
值得一提的是,Graphcore的IPU與CPU的硬件解耦,有助于IPU更好的拓展市場(chǎng)。比如在BERT訓(xùn)練中,Graphcore采用一臺(tái)2顆CPU的服務(wù)器和64顆IPU,比例為1:32,在計(jì)算機(jī)視覺(jué)模型中的比例則基本為1:8。但如果是英偉達(dá)或者英特爾的系統(tǒng),無(wú)論何種場(chǎng)景和模型,都會(huì)有一個(gè)固定的CPU和GPU比例,比如1:4或1:2。
寫在最后
AI芯片的競(jìng)爭(zhēng)最終依舊會(huì)演變?yōu)樯鷳B(tài)、商業(yè)的競(jìng)爭(zhēng)。在AI芯片的早期階段,雖然參與者眾多,但各自都在團(tuán)隊(duì)組建和產(chǎn)品開發(fā)的階段,AI芯片公司間并沒(méi)有真正的競(jìng)爭(zhēng)關(guān)系。隨著AI芯片的發(fā)布,以及落地的推進(jìn),AI芯片公司之間的競(jìng)爭(zhēng)才真正開始。
當(dāng)越來(lái)越多的領(lǐng)域和客戶開始關(guān)注AI的規(guī)模應(yīng)用和落地時(shí),自然會(huì)加劇AI芯片公司之間的競(jìng)爭(zhēng),這時(shí)候,已經(jīng)不再單純比拼硬件性能,軟件和生態(tài)才更能打動(dòng)最終用戶。
2022年,我們將看到AI芯片公司間的競(jìng)爭(zhēng)日趨激烈,我們也將慢慢看到AI芯片公司們真正的實(shí)力。雷峰網(wǎng)