智能擴(kuò)展之道:企業(yè)IT團(tuán)隊(duì)如何為AI配置恰到好處的算力
AI項(xiàng)目負(fù)責(zé)人很少會(huì)從深入討論基礎(chǔ)設(shè)施和硬件開(kāi)始,但經(jīng)驗(yàn)豐富的規(guī)?;瘜?shí)施者警告說(shuō),如果不持續(xù)戰(zhàn)略性地關(guān)注企業(yè)級(jí)關(guān)鍵基礎(chǔ),部署高價(jià)值生產(chǎn)工作負(fù)載將難以圓滿(mǎn)完成。
好消息:企業(yè)越來(lái)越認(rèn)識(shí)到,基礎(chǔ)設(shè)施在推動(dòng)收入增長(zhǎng)、降低成本和提高效率的生成式、智能體及其他智能應(yīng)用中發(fā)揮著關(guān)鍵作用。
據(jù)IDC統(tǒng)計(jì),到2025年,與去年同期相比,企業(yè)在A(yíng)I部署的計(jì)算和存儲(chǔ)硬件基礎(chǔ)設(shè)施上的支出將增長(zhǎng)97%,研究人員預(yù)測(cè),全球在該領(lǐng)域的投資將從目前的1500億美元激增至2028年的2000億美元。
但“競(jìng)爭(zhēng)優(yōu)勢(shì)并不屬于那些投入最多的企業(yè),”暢銷(xiāo)AI書(shū)籍作者兼The Hackett Group GenAI咨詢(xún)業(yè)務(wù)負(fù)責(zé)人John Thompson在接受采訪(fǎng)時(shí)表示,“而是屬于那些最明智地實(shí)現(xiàn)規(guī)?;钠髽I(yè)。”
忽視基礎(chǔ)設(shè)施和硬件,后果自負(fù)
其他專(zhuān)家也持相同觀(guān)點(diǎn),認(rèn)為如果沒(méi)有對(duì)處理器和加速器精細(xì)協(xié)調(diào)的網(wǎng)絡(luò)進(jìn)行精心規(guī)劃和適配,以及升級(jí)電力和冷卻系統(tǒng),企業(yè)幾乎不可能擴(kuò)展和工業(yè)化AI工作負(fù)載,這些專(zhuān)用硬件組件提供了處理從邊緣到本地再到云端前所未有的數(shù)據(jù)量、流動(dòng)性和速度所需的速度、可用性、靈活性和可擴(kuò)展性。
一項(xiàng)又一項(xiàng)的研究指出,與基礎(chǔ)設(shè)施相關(guān)的問(wèn)題,如性能瓶頸、硬件不匹配和遺留系統(tǒng)集成不佳,以及數(shù)據(jù)問(wèn)題,是導(dǎo)致試點(diǎn)項(xiàng)目失敗的主要原因。隨著對(duì)自主式AI的興趣和投資激增,技術(shù)、競(jìng)爭(zhēng)和財(cái)務(wù)風(fēng)險(xiǎn)也隨之增加。
在科技公司中,這一行業(yè)的風(fēng)向標(biāo)顯示,近50%的公司已開(kāi)展自主式AI項(xiàng)目,其余公司也將在24個(gè)月內(nèi)跟進(jìn),它們將當(dāng)前AI預(yù)算的一半或更多分配給智能體,許多公司還計(jì)劃在今年進(jìn)一步增加投入。(這是好事,因?yàn)檫@些復(fù)雜的自主系統(tǒng)需要昂貴且稀缺的GPU和TPU來(lái)在多個(gè)平臺(tái)上獨(dú)立實(shí)時(shí)運(yùn)行。)
從試點(diǎn)項(xiàng)目的經(jīng)驗(yàn)中,技術(shù)和業(yè)務(wù)領(lǐng)導(dǎo)者現(xiàn)在明白,AI工作負(fù)載的高要求——高速處理、網(wǎng)絡(luò)、存儲(chǔ)、編排和巨大電力需求——與他們以往大規(guī)模建設(shè)的任何東西都截然不同。
對(duì)許多企業(yè)來(lái)說(shuō),緊迫的問(wèn)題是:“我們準(zhǔn)備好這樣做了嗎?”誠(chéng)實(shí)的回答將是:如果不進(jìn)行持續(xù)的仔細(xì)分析、規(guī)劃和可能的重大IT升級(jí),答案將是否定的。
他們已攀登AI高峰——傾聽(tīng)他們的聲音
就像雪花和孩子一樣,我們被提醒,AI項(xiàng)目既相似又獨(dú)特。不同AI功能和類(lèi)型(訓(xùn)練與推理、機(jī)器學(xué)習(xí)與強(qiáng)化學(xué)習(xí))之間的需求差異巨大。業(yè)務(wù)目標(biāo)、預(yù)算、技術(shù)債務(wù)、供應(yīng)商鎖定以及可用技能和能力之間也存在巨大差異。
因此,可以預(yù)見(jiàn),沒(méi)有單一的“最佳”方法。根據(jù)情況,你可以選擇縱向擴(kuò)展(增加功率以應(yīng)對(duì)更大負(fù)載)、橫向擴(kuò)展(升級(jí)現(xiàn)有硬件)或混合方式。
盡管如此,這些早期階段的心態(tài)、原則、建議、實(shí)踐、真實(shí)案例和節(jié)省成本的技巧可以幫助你保持努力的方向正確。
這是一個(gè)多層次的挑戰(zhàn),涉及數(shù)據(jù)、軟件、網(wǎng)絡(luò)、安全和存儲(chǔ)。我們將保持高層次視角,并提供相關(guān)深入鏈接。
現(xiàn)代化你的AI基礎(chǔ)設(shè)施愿景
最大的心態(tài)轉(zhuǎn)變是采用新的AI觀(guān)念,不是將其視為獨(dú)立或孤立的應(yīng)用,而是將其視為嵌入業(yè)務(wù)流程、工作流和工具中的基礎(chǔ)能力或平臺(tái)。
為了實(shí)現(xiàn)這一點(diǎn),基礎(chǔ)設(shè)施必須平衡兩個(gè)重要角色:提供穩(wěn)定、安全和合規(guī)的企業(yè)基礎(chǔ),同時(shí)使快速可靠地部署專(zhuān)用AI工作負(fù)載和應(yīng)用變得容易,這些工作負(fù)載和應(yīng)用通常針對(duì)特定領(lǐng)域(如自然語(yǔ)言處理和強(qiáng)化學(xué)習(xí))進(jìn)行了硬件優(yōu)化。
本質(zhì)上,這是一個(gè)重大的角色轉(zhuǎn)變,德勤首席創(chuàng)新官Deb Golden表示:“AI必須被視為一個(gè)操作系統(tǒng),基礎(chǔ)設(shè)施要適應(yīng)它,而不是相反。”
她繼續(xù)說(shuō):“未來(lái)不僅僅關(guān)乎復(fù)雜的模型和算法,硬件不再是被動(dòng)的。因此,從現(xiàn)在起,基礎(chǔ)設(shè)施從根本上說(shuō)是關(guān)于協(xié)調(diào)智能硬件作為AI的操作系統(tǒng)?!?/p>
要以這種方式大規(guī)模且無(wú)浪費(fèi)地運(yùn)行,需要一種“流動(dòng)架構(gòu)”,Golden用這一術(shù)語(yǔ)來(lái)描述在每個(gè)平臺(tái)上實(shí)時(shí)適應(yīng)的動(dòng)態(tài)分配,從單個(gè)硅芯片到完整的工作負(fù)載。她的團(tuán)隊(duì)發(fā)現(xiàn),這種方法可以削減30%至40%的成本,并降低15%至20%的延遲?!叭绻愕腁I不能隨工作負(fù)載呼吸,它就會(huì)窒息?!?/p>
這是一個(gè)要求極高的挑戰(zhàn),這樣的AI基礎(chǔ)設(shè)施必須是多層的、云原生的、開(kāi)放的、實(shí)時(shí)的、動(dòng)態(tài)的、靈活的和模塊化的,它需要在邊緣和移動(dòng)設(shè)備、本地?cái)?shù)據(jù)中心、AI個(gè)人電腦和工作站以及混合和公有云環(huán)境中進(jìn)行高度智能的協(xié)調(diào)。
這聽(tīng)起來(lái)像是流行語(yǔ)大集合,但實(shí)際上代表了企業(yè)IT基礎(chǔ)設(shè)施在A(yíng)I時(shí)代持續(xù)進(jìn)化、重新定義和優(yōu)化的新紀(jì)元。主要元素是熟悉的:混合環(huán)境、快速增長(zhǎng)的日益專(zhuān)業(yè)化的云服務(wù)、框架和平臺(tái)宇宙。
在這個(gè)新篇章中,擁抱架構(gòu)模塊化是長(zhǎng)期成功的關(guān)鍵,安永美洲技術(shù)增長(zhǎng)負(fù)責(zé)人Ken Englund表示:“你集成不同工具、智能體、解決方案和平臺(tái)的能力將是至關(guān)重要的。模塊化為你的框架和架構(gòu)創(chuàng)造了靈活性?!?/p>
解耦系統(tǒng)組件有助于以多種方式面向未來(lái),包括供應(yīng)商和技術(shù)無(wú)關(guān)性、即插即用模型增強(qiáng)以及持續(xù)創(chuàng)新和可擴(kuò)展性。
為擴(kuò)展AI進(jìn)行基礎(chǔ)設(shè)施投資必須平衡謹(jǐn)慎與強(qiáng)大
尋求擴(kuò)大企業(yè)AI使用的企業(yè)技術(shù)團(tuán)隊(duì)面臨著一個(gè)更新的“金發(fā)姑娘挑戰(zhàn)”:找到能夠處理分布式、無(wú)處不在的AI快速增長(zhǎng)和變化需求的新基礎(chǔ)設(shè)施和硬件的“恰到好處”的投資水平。
投資不足或堅(jiān)持當(dāng)前處理能力?你將面臨導(dǎo)致整個(gè)項(xiàng)目(和職業(yè)生涯)失敗的嚴(yán)重性能瓶頸和不佳的業(yè)務(wù)成果。
過(guò)度投資于閃亮的新AI基礎(chǔ)設(shè)施?你將面臨巨大的資本和持續(xù)運(yùn)營(yíng)支出、閑置資源和無(wú)人需要的操作復(fù)雜性。
與其他IT努力相比,經(jīng)驗(yàn)豐富的規(guī)?;瘜?shí)施者一致認(rèn)為,簡(jiǎn)單地通過(guò)增加處理能力來(lái)解決問(wèn)題不是一種成功的策略,然而,這仍然是一種誘惑,即使不是完全故意的。
“那些AI需求極低的工作往往被路由到昂貴的GPU或TPU基礎(chǔ)設(shè)施上,”曾在財(cái)富500強(qiáng)公司領(lǐng)導(dǎo)企業(yè)AI部署并擔(dān)任一家大型全球咨詢(xún)公司AI卓越中心負(fù)責(zé)人的轉(zhuǎn)型資深人士Mine Bayrak Ozmen表示。
Ozmen也是AI平臺(tái)公司Riernio的聯(lián)合創(chuàng)始人,她表示:“諷刺的是,AI中心設(shè)計(jì)選擇已經(jīng)超越了更經(jīng)典的組織原則?!辈恍业氖牵@些部署的長(zhǎng)期成本低效可能會(huì)被硬件供應(yīng)商提供的深度折扣所掩蓋,她表示。
通過(guò)適當(dāng)范圍和分布來(lái)適配AI基礎(chǔ)設(shè)施,而非單純追求強(qiáng)大
那么,什么應(yīng)該指導(dǎo)戰(zhàn)略和戰(zhàn)術(shù)選擇呢?專(zhuān)家一致認(rèn)為,一個(gè)不應(yīng)指導(dǎo)選擇的是一種看似矛盾但誤導(dǎo)性的推理:因?yàn)锳I基礎(chǔ)設(shè)施必須提供超高性能,所以更強(qiáng)大的處理器和硬件必然更好。
“AI擴(kuò)展不是關(guān)于蠻力計(jì)算,”領(lǐng)導(dǎo)過(guò)眾多大型全球AI項(xiàng)目并著有《通往AGI之路:人工智能通用智能:過(guò)去、現(xiàn)在和未來(lái)》(該書(shū)于二月出版)的Hackett的Thompson表示。他和他人強(qiáng)調(diào),目標(biāo)是在正確的時(shí)間、正確的地點(diǎn)擁有正確的硬件,而不是在所有地方都擁有最強(qiáng)大和最壞的硬件。
據(jù)Ozmen稱(chēng),成功的擴(kuò)展者采用“一種為正確執(zhí)行而適配的方法”,這意味著“優(yōu)化工作負(fù)載放置(推理與訓(xùn)練)、管理上下文局部性,并利用政策驅(qū)動(dòng)的編排來(lái)減少冗余、提高可觀(guān)察性并推動(dòng)持續(xù)增長(zhǎng)?!?/p>
有時(shí),分析和決策就像在餐巾紙上簡(jiǎn)單勾勒一樣?!盀?00名員工服務(wù)的GenAI系統(tǒng)可能在一臺(tái)服務(wù)器上運(yùn)行得很好,”Thompson說(shuō),但對(duì)于更復(fù)雜的倡議來(lái)說(shuō),情況就完全不同了。
以一個(gè)為全球數(shù)十萬(wàn)用戶(hù)提供服務(wù)的AI賦能企業(yè)核心系統(tǒng)為例,該系統(tǒng)需要云原生故障轉(zhuǎn)移和嚴(yán)肅的擴(kuò)展能力。在這些情況下,Thompson說(shuō),適配基礎(chǔ)設(shè)施需要嚴(yán)格的范圍界定、分配和擴(kuò)展練習(xí)。否則就是魯莽的瀆職。
令人驚訝的是,這種基本的IT規(guī)劃紀(jì)律有時(shí)會(huì)被忽視。常常是那些急于獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的公司試圖通過(guò)將過(guò)大的基礎(chǔ)設(shè)施預(yù)算投入到關(guān)鍵AI項(xiàng)目上來(lái)加速進(jìn)程。
新的Hackett研究挑戰(zhàn)了一些關(guān)于擴(kuò)展AI所需基礎(chǔ)設(shè)施的基本假設(shè),為進(jìn)行嚴(yán)格的初步分析提供了更多理由。
Thompson自己的現(xiàn)實(shí)世界經(jīng)驗(yàn)很有啟發(fā)性。在構(gòu)建一個(gè)擁有超過(guò)30萬(wàn)用戶(hù)的AI客戶(hù)支持系統(tǒng)時(shí),他的團(tuán)隊(duì)很快意識(shí)到“全球覆蓋比在任何單一地點(diǎn)擁有巨大容量更重要”。因此,基礎(chǔ)設(shè)施分布在美國(guó)、歐洲和亞太地區(qū);用戶(hù)在全球范圍內(nèi)動(dòng)態(tài)路由。
實(shí)際的建議是什么?“設(shè)定界限。是30萬(wàn)用戶(hù)還是200用戶(hù)?范圍決定基礎(chǔ)設(shè)施?!彼f(shuō)。
在正確的地點(diǎn)為正確的任務(wù)配備正確的硬件
現(xiàn)代多層AI基礎(chǔ)設(shè)施策略依賴(lài)于多功能處理器和加速器,這些處理器和加速器可以針對(duì)連續(xù)體中的各種角色進(jìn)行優(yōu)化。
為AI擴(kuò)展采購(gòu)基礎(chǔ)設(shè)施:云服務(wù)成為大多數(shù)企業(yè)的首選
你現(xiàn)在對(duì)AI擴(kuò)展基礎(chǔ)設(shè)施的可能性和應(yīng)該是什么樣子有了清晰的認(rèn)識(shí),對(duì)投資的最佳點(diǎn)和范圍有了良好的了解,并且知道在哪里需要什么,現(xiàn)在是采購(gòu)的時(shí)候了。
正如VentureBeat上一期特刊所指出的,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),最有效的策略將是繼續(xù)使用基于云的基礎(chǔ)設(shè)施和設(shè)備來(lái)擴(kuò)展AI生產(chǎn)。
對(duì)大型組織的調(diào)查顯示,大多數(shù)已經(jīng)從定制的本地?cái)?shù)據(jù)中心過(guò)渡到公共云平臺(tái)和預(yù)構(gòu)建的AI解決方案。對(duì)許多人來(lái)說(shuō),這代表了正在進(jìn)行的現(xiàn)代化進(jìn)程的下一步,該進(jìn)程規(guī)避了巨大的前期資本支出和人才爭(zhēng)奪,同時(shí)為快速變化的需求提供了關(guān)鍵靈活性。
Gartner預(yù)測(cè),未來(lái)三年內(nèi),50%的云計(jì)算資源將專(zhuān)用于A(yíng)I工作負(fù)載,而目前這一比例不到10%。一些企業(yè)還在升級(jí)本地?cái)?shù)據(jù)中心,配備加速計(jì)算、更快內(nèi)存和高速網(wǎng)絡(luò)。
好消息是:Amazon、AWS、Microsoft、Google以及不斷壯大的專(zhuān)業(yè)提供商群體繼續(xù)在為AI構(gòu)建和優(yōu)化的端到端產(chǎn)品上投入巨額資金,包括全棧基礎(chǔ)設(shè)施、平臺(tái)、處理(包括GPU云提供商)、HPC、存儲(chǔ)(超大規(guī)模提供商加上Dell、HPE、Hitachi Vantara)、框架和眾多其他托管服務(wù)。
特別是對(duì)于那些希望快速?lài)L試的企業(yè)來(lái)說(shuō),西北AI咨詢(xún)公司的首席AI顧問(wèn)Wyatt Mayham表示,云服務(wù)提供了一個(gè)優(yōu)秀且低麻煩的選擇。
例如,在已經(jīng)使用Microsoft的公司中,“Azure OpenAI是一個(gè)自然的擴(kuò)展[需要很少的架構(gòu)就能安全合規(guī)地運(yùn)行],”他說(shuō),“它避免了構(gòu)建自定義大語(yǔ)言模型基礎(chǔ)設(shè)施的復(fù)雜性,同時(shí)仍然為公司提供了所需的安全性和控制。這是一個(gè)很好的快速取勝的使用案例?!?/p>
然而,技術(shù)決策者面臨的眾多選擇也有另一面。選擇合適的服務(wù)可能令人望而生畏,特別是當(dāng)更多企業(yè)選擇跨多個(gè)提供商的多云方法時(shí)。兼容性、一致的安全性、責(zé)任、服務(wù)水平和現(xiàn)場(chǎng)資源需求等問(wèn)題可能迅速交織成一個(gè)復(fù)雜的網(wǎng)絡(luò),減緩開(kāi)發(fā)和部署速度。
為了簡(jiǎn)化事情,企業(yè)可能決定堅(jiān)持使用一兩個(gè)主要提供商。在這里,就像在A(yíng)I前的云托管中一樣,供應(yīng)商鎖定的危險(xiǎn)隱現(xiàn)(盡管開(kāi)放標(biāo)準(zhǔn)提供了選擇的可能性)。所有這些都籠罩在過(guò)去和最近嘗試遷移到付費(fèi)云服務(wù)的陰影下,人們驚恐地發(fā)現(xiàn)成本遠(yuǎn)遠(yuǎn)超出了最初的預(yù)期。
所有這些都解釋了為什么專(zhuān)家說(shuō),在開(kāi)始采購(gòu)之前,盡可能清楚地了解邊緣、本地、云應(yīng)用等各個(gè)地方所需的性能和容量是至關(guān)重要的IT 101紀(jì)律。
重新審視本地基礎(chǔ)設(shè)施
傳統(tǒng)觀(guān)點(diǎn)認(rèn)為,內(nèi)部處理基礎(chǔ)設(shè)施主要留給資金雄厚的企業(yè)和受高度監(jiān)管的行業(yè),然而,在這個(gè)新的AI篇章中,關(guān)鍵內(nèi)部元素正在被重新評(píng)估,通常作為混合適配策略的一部分。
以Microblink為例,該公司為全球客戶(hù)提供AI驅(qū)動(dòng)的文檔掃描和身份驗(yàn)證服務(wù)。使用Google Cloud Platform(GCP)支持高吞吐量的機(jī)器學(xué)習(xí)工作負(fù)載和數(shù)據(jù)密集型應(yīng)用時(shí),該公司很快遇到了成本和可擴(kuò)展性問(wèn)題,工程經(jīng)理Filip Suste表示?!癎PU可用性有限、不可預(yù)測(cè)且昂貴?!彼赋?。
為了解決這些問(wèn)題,Suste的團(tuán)隊(duì)進(jìn)行了戰(zhàn)略調(diào)整,將計(jì)算機(jī)工作負(fù)載和支持基礎(chǔ)設(shè)施轉(zhuǎn)移到本地。向混合模式轉(zhuǎn)變的關(guān)鍵是從MinIo引入的高性能、云原生對(duì)象存儲(chǔ)系統(tǒng)。
對(duì)Microblink來(lái)說(shuō),將關(guān)鍵基礎(chǔ)設(shè)施帶回內(nèi)部取得了回報(bào),這樣做削減了62%的相關(guān)成本,減少了閑置容量并提高了訓(xùn)練效率,該公司表示。最重要的是,它重新獲得了對(duì)AI基礎(chǔ)設(shè)施的控制,從而提高了客戶(hù)安全性。
考慮專(zhuān)業(yè)AI平臺(tái)
日本計(jì)算機(jī)數(shù)控加工中心制造商Makino在40個(gè)國(guó)家開(kāi)展業(yè)務(wù),面臨著一個(gè)典型的技能差距問(wèn)題。經(jīng)驗(yàn)較少的工程師完成維修可能需要長(zhǎng)達(dá)30小時(shí),而經(jīng)驗(yàn)豐富的工人只需8小時(shí)。
為了縮小差距并改善客戶(hù)服務(wù),領(lǐng)導(dǎo)層決定將二十年的維護(hù)數(shù)據(jù)轉(zhuǎn)化為即時(shí)可用的專(zhuān)業(yè)知識(shí)。他們得出的最快且最具成本效益的解決方案是將現(xiàn)有服務(wù)管理系統(tǒng)與Aquant的專(zhuān)業(yè)服務(wù)人員AI平臺(tái)集成。
該公司表示,采取這種簡(jiǎn)便的技術(shù)路徑取得了巨大成功。資源集中在標(biāo)準(zhǔn)化術(shù)語(yǔ)和開(kāi)發(fā)流程和程序上,而不是費(fèi)力地評(píng)估不同的基礎(chǔ)設(shè)施場(chǎng)景,Makino的客戶(hù)支持總監(jiān)Ken Creech解釋道。
遠(yuǎn)程問(wèn)題解決率提高了15%,解決方案時(shí)間縮短,客戶(hù)現(xiàn)在可以自助訪(fǎng)問(wèn)系統(tǒng),Creech說(shuō)?!艾F(xiàn)在,我們的工程師提出一個(gè)簡(jiǎn)單語(yǔ)言問(wèn)題,AI就能迅速找到答案。這是一個(gè)巨大的驚喜因素?!?/p>
采用有意識(shí)的成本規(guī)避技巧
在美國(guó)最大的食品和藥品連鎖店之一Albertsons,IT團(tuán)隊(duì)采用了幾種簡(jiǎn)單但有效的策略來(lái)優(yōu)化AI基礎(chǔ)設(shè)施,而無(wú)需添加新硬件,數(shù)據(jù)分析、工程和治理技術(shù)負(fù)責(zé)人Chandrakanth Puligundla表示。
例如,重力映射顯示了數(shù)據(jù)存儲(chǔ)的位置以及數(shù)據(jù)如何在邊緣設(shè)備、內(nèi)部系統(tǒng)或多云系統(tǒng)上移動(dòng)。Puligundla解釋說(shuō),這種知識(shí)不僅減少了出口成本和延遲,還指導(dǎo)了關(guān)于在哪里分配計(jì)算資源的更明智決策。
同樣,他說(shuō),使用專(zhuān)業(yè)AI工具進(jìn)行語(yǔ)言處理或圖像識(shí)別占用的空間更少,通常比添加或更新更昂貴的服務(wù)器和通用計(jì)算機(jī)提供更好的性能和經(jīng)濟(jì)性。
另一個(gè)成本規(guī)避技巧:跟蹤每推理或訓(xùn)練小時(shí)的瓦數(shù)。超越速度和成本,關(guān)注能效指標(biāo)優(yōu)先考慮了可持續(xù)性能,這對(duì)日益耗電的AI模型和硬件至關(guān)重要。
Puligundla總結(jié)道:“通過(guò)這種有意識(shí)的準(zhǔn)備,我們真的可以提高效率?!?/p>
書(shū)寫(xiě)你自己的結(jié)局
AI試點(diǎn)項(xiàng)目的成功已經(jīng)將數(shù)百萬(wàn)家公司帶入了下一個(gè)階段:將具有高商業(yè)價(jià)值的生成式和大語(yǔ)言模型、智能體和其他智能應(yīng)用部署到更廣泛的生產(chǎn)中。
最新的AI篇章為那些能夠戰(zhàn)略性地構(gòu)建基礎(chǔ)設(shè)施和硬件的企業(yè)承諾了豐厚回報(bào),這些基礎(chǔ)設(shè)施和硬件在邊緣計(jì)算、本地系統(tǒng)和云環(huán)境中平衡了性能、成本、靈活性和可擴(kuò)展性。
在接下來(lái)的幾個(gè)月里,隨著行業(yè)投資繼續(xù)涌入超大規(guī)模數(shù)據(jù)中心、邊緣芯片和硬件(AMD、Qualcomm、Huawei)、基于云的AI全?;A(chǔ)設(shè)施(如Canonical和Guru)、上下文感知內(nèi)存、安全的本地即插即用設(shè)備(如Lemony)等等,擴(kuò)展選項(xiàng)將進(jìn)一步擴(kuò)大。
IT和業(yè)務(wù)領(lǐng)導(dǎo)者如何明智地規(guī)劃和選擇擴(kuò)展基礎(chǔ)設(shè)施,將決定公司故事中的英雄和那些注定要陷入試點(diǎn)困境或AI災(zāi)難的不幸者。