CIO 分享:正在重新考慮如何使用公有云服務(wù)
成本、數(shù)據(jù)隱私和性能問(wèn)題讓IT高管開(kāi)始重新評(píng)估多租戶公有云服務(wù)應(yīng)該包含哪些內(nèi)容。
過(guò)去幾年,企業(yè)一直努力盡快地把盡可能多的資源轉(zhuǎn)移到公有云,最大限度上減少資本支出并節(jié)省資金。然而,CIO們?cè)絹?lái)越多地審查這些投資,這真的能提高生產(chǎn)力并降低成本嗎?
Forrester首席分析師Tracy Woo表示:“在涌向公有云的過(guò)程中,很多人并沒(méi)有考慮定價(jià)問(wèn)題?!睂?duì)于一些組織來(lái)說(shuō),年度云支出在大幅增加。“云計(jì)算支出不斷增加,而預(yù)算卻在緊縮,所以他們?cè)趩?wèn)到底發(fā)生了什么,我們?nèi)绾尾拍芘まD(zhuǎn)局面?!?/p>
Reinsurance Group of America (RGA)高級(jí)副總裁、首席技術(shù)官Ron Hollowell表示,2025年的計(jì)劃是通過(guò)完善跨私有云和公有云的工作接收、分配標(biāo)準(zhǔn)和實(shí)施實(shí)踐流程,專注于合理調(diào)整公有云的規(guī)模。他說(shuō):“費(fèi)用優(yōu)化和明確定義的工作負(fù)載選擇標(biāo)準(zhǔn),將決定哪些應(yīng)用到公有云,哪些應(yīng)用到私有云?!?/p>
作為軟件公司Endava的云功能副總裁,Radu Vunvulea為很多大型企業(yè)的CIO提供咨詢。他說(shuō):“今年,我們將更多地討論混合云、多云和本地部署,”其中的原因包括成本高于預(yù)期,但也包括性能和延遲問(wèn)題;安全、數(shù)據(jù)隱私和合規(guī)性問(wèn)題;以及影響數(shù)據(jù)定位、傳輸和處理位置的區(qū)域數(shù)字主權(quán)法規(guī)。
“利用私有云而非公有云的主要驅(qū)動(dòng)因素是成本,”Hollowell說(shuō)。他認(rèn)為,公有云對(duì)于季節(jié)性或突發(fā)性的、按需的工作負(fù)載而言最具成本效益?!皩?duì)于容量需求一致性更高的工作負(fù)載來(lái)說(shuō),私有云和固定容量解決方案的經(jīng)濟(jì)性可能更具吸引力?!?/p>
對(duì)于其他很多CIO來(lái)說(shuō),主要?jiǎng)訖C(jī)也是成本,Vunvulea說(shuō)。雖然Endava的企業(yè)級(jí)系統(tǒng)中有多達(dá)80%的部分或全部都是使用公有云的,但其中約60%的公司正在遷移回至少一個(gè)系統(tǒng)?!拔覀冋J(rèn)為這更像是一種趨勢(shì),”他說(shuō)。
這些工作負(fù)載去哪了?Woo說(shuō):“人們重新關(guān)注本地環(huán)境、本地私有云、或者托管私有云與公有云,尤其是當(dāng)數(shù)據(jù)密集型工作負(fù)載——例如生成式AI——開(kāi)始大幅推高云計(jì)算支出時(shí)。通過(guò)將應(yīng)用遷移回本地,或使用本地或托管私有云服務(wù),CIO可以避免多租戶,同時(shí)確保數(shù)據(jù)隱私。”這就是為什么Forrester預(yù)測(cè)有五分之四所謂的云計(jì)算領(lǐng)導(dǎo)者今年將增加20%的私有云投資的原因之一。
話雖如此,2025年不僅僅是關(guān)于回流。“由于生成式AI、成本、主權(quán)問(wèn)題和性能要求,私有云投資正在增加,但公有云投資也在增加,因?yàn)椴捎寐侍岣?、生成式AI服務(wù)、基礎(chǔ)設(shè)施占用空間減少、新增基礎(chǔ)設(shè)施等等因素,”Woo說(shuō)。
公有云的隱性成本
St. Jude’s Research Hospital的高級(jí)副總裁兼首席信息官Keith Perry表示,對(duì)該醫(yī)院來(lái)說(shuō),公有云是一種將知識(shí)傳遞到目前不屬于其生態(tài)系統(tǒng)的研究人員手中的一種好方法。該醫(yī)院使用本地超級(jí)計(jì)算機(jī)來(lái)生成大量研究數(shù)據(jù),而將這些數(shù)據(jù)移入和移出公有云可能是成本很高的。他說(shuō):“學(xué)術(shù)界希望數(shù)據(jù)在位置上接近高性能計(jì)算資源,因此他們經(jīng)常為這些出口費(fèi)用而苦惱?!?/p>
但數(shù)據(jù)密集型工作負(fù)載的成本可能很高,尤其是在需要持續(xù)的、高計(jì)算的情況下?!傲硪粋€(gè)驅(qū)動(dòng)因素是數(shù)據(jù)移動(dòng),不僅在金錢方面,還有性能方面,因此,我們會(huì)仔細(xì)管理數(shù)據(jù)生命周期,以盡量減少云之間的傳輸?!?/p>
Woo補(bǔ)充說(shuō),對(duì)于數(shù)據(jù)密集型工作負(fù)載,公有云的成本很高,因?yàn)榻M織需要為存儲(chǔ)的數(shù)據(jù)和在可用區(qū)、區(qū)域和云之間傳輸?shù)臄?shù)據(jù)付費(fèi)。廠商還會(huì)對(duì)離開(kāi)和進(jìn)入給定可用區(qū)的數(shù)據(jù)收取出口費(fèi)?!耙虼?,對(duì)于可用區(qū)之間的傳輸,你實(shí)際上被收了兩次費(fèi)用,這些隱藏的傳輸費(fèi)用可能會(huì)累積起來(lái)。”Vunvulea表示,數(shù)據(jù)傳輸?shù)某杀?,尤其是以PB為單位的成本很高,而且數(shù)據(jù)傳輸和同步可能很復(fù)雜?!拔覀円呀?jīng)看到一些AI項(xiàng)目,其中大約45%的云成本是通過(guò)將數(shù)據(jù)從公有云移動(dòng)到另一個(gè)位置而產(chǎn)生的,如果你把整個(gè)系統(tǒng)與服務(wù)所需的一切整合到一起,你得到的解決方案的成本可能會(huì)比最初估計(jì)的要高出三到四倍?!?/p>
例如,那些使用Open AI構(gòu)建AI解決方案的組織,需要考慮的不僅僅是AI服務(wù),還需要一個(gè)存儲(chǔ)庫(kù)來(lái)保護(hù)機(jī)密數(shù)據(jù),以及定義和配置安全設(shè)備和策略,以確保只有合格的人員和服務(wù)才允許訪問(wèn)。安全存儲(chǔ)以及數(shù)據(jù)轉(zhuǎn)換、監(jiān)控、審計(jì)和合規(guī)層都增加了系統(tǒng)的復(fù)雜性,圍繞AI服務(wù),你需要構(gòu)建一個(gè)解決方案,其中包含另外10到12個(gè)不同的云服務(wù),以滿足企業(yè)系統(tǒng)的需求。
礦業(yè)公司Mosaic Company的首席信息官Jeff Wysocki承認(rèn)很擔(dān)憂這些預(yù)算超支,但他表示,CIO也許可以與他們的公有云提供商合作,控制這些成本。例如,Mosaic最近為微軟Bing平臺(tái)上的采礦業(yè)務(wù)創(chuàng)建了一個(gè)數(shù)據(jù)密集型的Mosaic GPT安全模型,而且即將在試點(diǎn)中推出該模型,其中包含了Mosaic多年來(lái)在模型中積累的安全信息,因此在采礦現(xiàn)場(chǎng)工作的承包商可以輸入有關(guān)安全的問(wèn)題,了解如何處理特定情況。
“我們對(duì)架構(gòu)進(jìn)行了改進(jìn),以解決成本問(wèn)題,”他說(shuō)。Mosaic團(tuán)隊(duì)如何構(gòu)建模型,以及微軟如何設(shè)計(jì)解決方案,有助于將項(xiàng)目控制在預(yù)算之內(nèi)?!拔覀兣c微軟一起進(jìn)行了一些更改,以將成本降低到我們認(rèn)為合理的范圍?!?/p>
Wysocki說(shuō),Mosaic的ERP系統(tǒng)最初駐留在私有云中,但現(xiàn)在在SAP是運(yùn)行在私有云中的。但他補(bǔ)充說(shuō),一些服務(wù)器將始終位于本地,這不太可能改變,但可能會(huì)有具有云同步功能的邊緣服務(wù)器解決方案。“我認(rèn)為這種情況不會(huì)比現(xiàn)在的情況有太大變化?!痹摴?0%到85%的IT運(yùn)營(yíng)都是在云端的,他預(yù)計(jì)這種狀況將持續(xù)下去。
AI項(xiàng)目可能會(huì)超出預(yù)算
由于AI和機(jī)器學(xué)習(xí)是數(shù)據(jù)密集型的,這些項(xiàng)目可能會(huì)大大增加云成本。Gartner云、邊緣和AI基礎(chǔ)設(shè)施服務(wù)和技術(shù)副總裁Sid Nag表示,在使用ChatGPT 3.5和4.0等更大型基礎(chǔ)模型時(shí),企業(yè)組織別無(wú)選擇,因?yàn)樗璧挠?jì)算能力規(guī)模太高,無(wú)法在內(nèi)部復(fù)制。
然而Gartner預(yù)測(cè),到2027年,企業(yè)使用的新一代AI大型語(yǔ)言模型中有50%多將是針對(duì)特定行業(yè)的,這些將是從非常大規(guī)模的通用基礎(chǔ)模型中分離出來(lái)的小得多的模型,可以運(yùn)行在其他地方。即使企業(yè)組織使用RedHat InstructLab等工具用公司特定數(shù)據(jù)增強(qiáng)這些行業(yè)特定模型,相比之下仍然是很小的。Nag說(shuō):“行業(yè)特定模型……需要更少的資源來(lái)訓(xùn)練,因此可以運(yùn)行在本地、私有云或托管的私有云基礎(chǔ)設(shè)施中?!?/p>
但是Vunvulea說(shuō),訓(xùn)練或優(yōu)化模型所需的計(jì)算能力和基礎(chǔ)設(shè)施并不容易在本地找到或購(gòu)買到?!坝?jì)算需求是最重要的因素之一,”幸運(yùn)的是,云廠商還提供現(xiàn)成的AI平臺(tái),企業(yè)可以使用這些平臺(tái)根據(jù)自己的數(shù)據(jù)進(jìn)行模型訓(xùn)練。“因此,即使你決定在本地運(yùn)行系統(tǒng),也不需要配置它?!?/p>
但你應(yīng)該這樣做嗎?Nag說(shuō):“我會(huì)謹(jǐn)慎選擇私有云托管或本地,除非有令人信服的理由,否則決策者拒絕回到資本支出時(shí)代的想法?!?/p>
Vunvulea表示,云廠商會(huì)繼續(xù)提供更多的AI和ML服務(wù),作為他們平臺(tái)即服務(wù)產(chǎn)品中的一個(gè)組成部分。你可以從預(yù)訓(xùn)練模型開(kāi)始,使用自己的數(shù)據(jù),然后就可以毫無(wú)問(wèn)題地使用這項(xiàng)服務(wù)了?!拔覀兗磳⒖吹?,公有云廠商提供的模型已經(jīng)足夠成熟,可以滿足大多數(shù)公司90%的標(biāo)準(zhǔn)需求?!笔欠袷褂眠@些服務(wù)的問(wèn)題將歸結(jié)為成本問(wèn)題:這些數(shù)字對(duì)你的業(yè)務(wù)模式來(lái)說(shuō)是否合理?
價(jià)格低廉但表現(xiàn)不佳
Woo表示,起初CIO們專注于降低成本,但這并不總是與性能考慮或最終目標(biāo)相一致的。即使公有云是成本較低的選擇,如果考慮到潛在的延遲或其他性能問(wèn)題,也可能不是最合適的選擇。Vunvulea表示,對(duì)于那些無(wú)法容忍延遲的行業(yè)(例如支付處理和金融服務(wù))來(lái)說(shuō),情況尤其如此。
Perry說(shuō):“生成數(shù)據(jù)的儀器和處理數(shù)據(jù)的計(jì)算能力之間的延遲,是確定數(shù)據(jù)位置的重要變量。”在某些情況下,這種儀器需要幾乎即時(shí)連接到高性能計(jì)算資源?!坝捎谘芯?jī)x器與我們本地的高性能計(jì)算機(jī)和公有云之間存在延遲,所以使用公有云執(zhí)行實(shí)時(shí)檢查是沒(méi)有意義的。”他說(shuō),隨著越來(lái)越多的公有云超大規(guī)模企業(yè)構(gòu)建了能夠處理高性能計(jì)算的大規(guī)模GPU集群,你還必須考慮成本因素。
如果價(jià)格合適,基因組測(cè)序是一個(gè)將部分處理從本地超級(jí)計(jì)算機(jī)轉(zhuǎn)移到公有云可能很有意義的領(lǐng)域。Perry表示,隨著時(shí)間的推移,與基因組測(cè)序相關(guān)的一些工作流程會(huì)變得標(biāo)準(zhǔn)化。在這些情況下,根據(jù)成本優(yōu)化管道進(jìn)行擴(kuò)展并在云中運(yùn)行它們可能更有意義。他說(shuō):“我們致力于將部分基因組測(cè)序流程遷移到云端,以釋放本地高性能計(jì)算的周期?!?/p>
性能當(dāng)然很重要,但并不是選擇是否在公有云中托管應(yīng)用的決定性因素——除了一些在Mosaic采礦作業(yè)站點(diǎn)的邊緣服務(wù)器上運(yùn)行的應(yīng)用,Wysocki說(shuō)。“對(duì)于我們來(lái)說(shuō),始終需要邊緣計(jì)算,這些計(jì)算需要在設(shè)備上或設(shè)備附近才是有效的。”
位置問(wèn)題
“安全、隱私和成本是我們考慮的三個(gè)主要因素,”Wysocki補(bǔ)充說(shuō)。但到目前為止,安全和隱私并不是公有云服務(wù)的主要問(wèn)題。
Hollowell表示,Reinsurance Group of America對(duì)公有云服務(wù)的安全性很滿意?!拔覀冋谕ㄟ^(guò)AWS Bedrock服務(wù)利用Anthropic、Mitral和其他公司的基礎(chǔ)模型,該服務(wù)提供了數(shù)據(jù)隔離和安全性,”這讓企業(yè)能夠在安全環(huán)境中提供類似ChatGPT的功能。
但Woo表示,另一個(gè)問(wèn)題是數(shù)字主權(quán)。在有嚴(yán)格本地化規(guī)則的國(guó)家,公有云可能行不通?!澳憧梢赃x擇本地私有云或托管私有云,由你或他人管理,無(wú)論哪種方式,你都可以控制數(shù)據(jù)的存放位置?!?/p>
但監(jiān)管環(huán)境并不是唯一因素,Hollowell表示?!霸谀承┑貐^(qū),數(shù)據(jù)本地化和隱私要求直接納入到客戶合同中?!痹谶@種情況下,私有云可能提供更靈活的解決方案。因此,對(duì)于在多個(gè)國(guó)家/地區(qū)運(yùn)營(yíng)的大型組織而言,本地和云的混合方法是最佳選擇,Vunvulea表示。至于區(qū)域法規(guī),公有云提供商的選擇很重要?!袄纾绻阆朐谥袞|特定位置運(yùn)行工作負(fù)載,Oracle云是最佳的選擇之一,”他說(shuō),每個(gè)國(guó)家或地區(qū)在處理數(shù)據(jù)方面都有自己的法規(guī)。沒(méi)有一家云提供商在所有這些國(guó)家都有業(yè)務(wù),但Oracle在這些國(guó)家或地區(qū)擁有巨大的影響力,因此你可以與Oracle和其他云廠商合作運(yùn)行本地工作負(fù)載。
但Hollowell表示,混合云也有缺點(diǎn)。他說(shuō):“在公有云和混合云環(huán)境中管理大型數(shù)據(jù)集的互操作性和性能,仍然是需要解決的關(guān)鍵挑戰(zhàn)?!?/p>
保持靈活性,隨時(shí)準(zhǔn)備調(diào)整
展望未來(lái),Hollowell表示,“我們的戰(zhàn)略意圖是通過(guò)不斷發(fā)展的新功能業(yè)務(wù)需求,結(jié)合自然的應(yīng)用生命周期管理實(shí)踐來(lái)評(píng)估托管決策,而不是簡(jiǎn)單地將所有內(nèi)容遷移到公有云?!本哂幸恢氯萘啃枨笄铱梢酝ㄟ^(guò)傳統(tǒng)融合型基礎(chǔ)設(shè)施滿足的應(yīng)用,將運(yùn)行在私有云中,而那些不始終需要高計(jì)算的應(yīng)用仍將是公有云的候選者。
對(duì)于Perry來(lái)說(shuō),為組織的應(yīng)用構(gòu)建正確的IT基礎(chǔ)設(shè)施,就是要使用正確的建筑材料?!肮性浦皇俏覀儤?gòu)建架構(gòu)解決方案所需的材料之一,你必須取得適當(dāng)?shù)钠胶??!?/p>
遺憾的是,優(yōu)化本地環(huán)境、私有云和公有云服務(wù)的組合,是一個(gè)不斷變化的目標(biāo)。Perry說(shuō):“我不能說(shuō)一切都在正確的位置,因?yàn)榧夹g(shù)是不斷發(fā)展的?!彼ㄗh,云技術(shù)總是在變化,所以要做好準(zhǔn)備,能夠與時(shí)俱進(jìn)。確保擁有正確的工具來(lái)做到這一點(diǎn)非常重要,因?yàn)槟憬裉鞊碛械墓ぞ呖赡懿皇悄忝魈煨枰墓ぞ摺?/p>
Vunvulea表示,隨著技術(shù)進(jìn)步,需要做出改變,這也是你應(yīng)該避免廠商鎖定的原因之一。這是一個(gè)難題,因?yàn)橐宰顑?yōu)化的方式運(yùn)行云工作負(fù)載,你可能需要使用廠商最先進(jìn)的專有功能。
但他說(shuō),最終你希望避免鎖定,以便能夠更輕松地在本地環(huán)境、公有云和私有云之間移動(dòng)。