數(shù)據(jù)多副本保留:AI時(shí)代企業(yè)存儲的戰(zhàn)略重點(diǎn)
預(yù)計(jì)到2028年,AI的應(yīng)用將促使企業(yè)數(shù)據(jù)存儲需求呈現(xiàn)指數(shù)級增長態(tài)勢。根據(jù)我們于2024年11月開展的一項(xiàng)調(diào)查顯示,在主要依賴云存儲管理AI數(shù)據(jù)的基礎(chǔ)設(shè)施采購決策者中,61%的受訪者預(yù)計(jì)其存儲需求到2028年將至少實(shí)現(xiàn)翻番。驅(qū)動這一需求增長的關(guān)鍵因素包括:
數(shù)據(jù)保留周期的顯著延長(從6個(gè)月延長至永久保存);
- 73%的受訪者表示,他們采用了每日或每周一次的大型語言模型(LLM)檢查點(diǎn)機(jī)制
- 80%的受訪者認(rèn)為數(shù)據(jù)多副本對于AI數(shù)據(jù)管理“至關(guān)重要”或“較為重要”。
在已使用或計(jì)劃使用AI的存儲采購決策者中,95%的受訪者正采取措施應(yīng)對不斷增長的存儲需求,其中:
- 61%的受訪者正轉(zhuǎn)向更具擴(kuò)展性的存儲解決方案,
- 56%的受訪者選擇實(shí)施數(shù)據(jù)管理軟件,
- 49%的受訪者采用數(shù)據(jù)壓縮技術(shù),
- 55%的受訪者則決定升級現(xiàn)有存儲基礎(chǔ)設(shè)施。
我們的研究揭示,無論AI技術(shù)應(yīng)用于哪個(gè)領(lǐng)域,企業(yè)都需對現(xiàn)有存儲實(shí)踐進(jìn)行升級,以充分挖掘AI的潛力。
超越傳統(tǒng)存儲模式適應(yīng)變革
隨著存儲需求的持續(xù)增長,云端與本地存儲(On-premises storage)的使用量預(yù)計(jì)都將穩(wěn)步增加。根據(jù)1062位受訪者的反饋,云存儲仍將是AI數(shù)據(jù)存儲的主流模式。
2024年,65%的AI數(shù)據(jù)存儲于云端,預(yù)計(jì)到2028年,這一比例將提升至69%(見圖1)。
圖1:客戶存儲中云存儲占比的現(xiàn)狀與未來趨勢
在主要使用云存儲的受訪者中,**61%**預(yù)計(jì)未來三年內(nèi)的存儲需求將增長超過一倍。
此外,46%的受訪者認(rèn)為現(xiàn)有的數(shù)據(jù)存儲方式難以滿足日益增長的需求。因此,企業(yè)正在采用更多新型數(shù)據(jù)存儲解決方案,以應(yīng)對AI生成的日益龐大的文件數(shù)量和文件大?。ㄒ妶D2)。具體措施涵蓋:
- 61%的受訪者擴(kuò)大了云存儲解決方案的應(yīng)用范圍,
- 55%的受訪者選擇升級現(xiàn)有基礎(chǔ)設(shè)施,
- 56%的受訪者采用了更強(qiáng)大的數(shù)據(jù)管理軟件,
- 49%的受訪者則實(shí)施了數(shù)據(jù)壓縮技術(shù)。
圖2:企業(yè)為應(yīng)對AI驅(qū)動的數(shù)據(jù)增長所采取的措施
AI基礎(chǔ)設(shè)施的關(guān)鍵構(gòu)成部分
調(diào)查表明,從AI基礎(chǔ)設(shè)施采購者的角度來看,存儲被視為AI基礎(chǔ)設(shè)施第二重要的組成部分,僅次于安全(見圖3)。
圖3:AI基礎(chǔ)設(shè)施各組成部分的重要性排名
- 25%的受訪者認(rèn)為安全是最重要的基礎(chǔ)設(shè)施要素,
- 18%的受訪者則選擇了存儲。
- 此外,66%的受訪者將存儲列入其前四大基礎(chǔ)設(shè)施關(guān)注點(diǎn),
- 68%的受訪者則將安全列入前四大關(guān)注點(diǎn)。
盡管算力和能源消耗在過去幾年一直是AI領(lǐng)域的熱門話題,但從存儲基礎(chǔ)設(shè)施采購決策者的角度來看,存儲和安全的重要性更為突出。
AI模型的數(shù)據(jù)保留推動存儲增長
在已采納AI技術(shù)的受訪者中,90%的受訪者認(rèn)為延長數(shù)據(jù)存儲周期能夠顯著提升AI的輸出效果(見圖4)。其中,93%的受訪者表示,由于實(shí)施AI及提升模型精度(包括檢查點(diǎn)機(jī)制),他們的數(shù)據(jù)保留需求發(fā)生了變化。
企業(yè)使用的存儲容量越多,越傾向于認(rèn)為更長的數(shù)據(jù)保留期能提升AI輸出質(zhì)量(見圖4)。
圖4:不同存儲使用量企業(yè)對更長數(shù)據(jù)保留周期提升AI效果的認(rèn)知
此外,數(shù)據(jù)多副本在企業(yè)AI數(shù)據(jù)管理戰(zhàn)略中的重要性,也推動了企業(yè)存儲使用量的增加(見圖4)。
在當(dāng)前已使用AI并擁有超過100PB存儲容量的企業(yè)受訪者中,52%的受訪者認(rèn)為數(shù)據(jù)多副本對提升AI效果具有至關(guān)重要的作用。
73%的受訪者指出,AI模型訓(xùn)練推動了數(shù)據(jù)存儲需求的增長,原因在于他們需要每日或每周對先前保存的AI檢查點(diǎn)數(shù)據(jù)進(jìn)行備份(見圖5)。存儲AI檢查點(diǎn)數(shù)據(jù)不僅直接增加了存儲需求,還促使基礎(chǔ)設(shè)施采購者考慮在大型語言模型訓(xùn)練過程中,每個(gè)檢查點(diǎn)數(shù)據(jù)的具體保存周期。
在每日保存檢查點(diǎn)的受訪企業(yè)中(占總數(shù)的28%):
- 32%的企業(yè)將檢查點(diǎn)數(shù)據(jù)保留12個(gè)月以上,
- 29%的企業(yè)保留6到12個(gè)月。
對于當(dāng)前存儲容量已達(dá)到100PB以上的企業(yè)而言,他們通常以每日或每周的頻率保存并備份檢查點(diǎn)數(shù)據(jù),其中87%的企業(yè)選擇將這些檢查點(diǎn)數(shù)據(jù)存儲在云端,或同時(shí)采用HDD和SSD的混合存儲方案(見圖6)。
圖5:不同存儲使用量企業(yè)AI模型訓(xùn)練檢查點(diǎn)的保存頻率
圖6:擁有100PB以上存儲的企業(yè)檢查點(diǎn)備份頻率與存儲位置
AI應(yīng)用的普及將持續(xù)推動未來存儲需求增長
隨著AI應(yīng)用場景的不斷拓展和普及,Recon Analytics預(yù)計(jì)企業(yè)的存儲需求將呈現(xiàn)指數(shù)級增長態(tài)勢。當(dāng)企業(yè)從AI的早期試驗(yàn)階段逐步過渡到激活狀態(tài)并深入應(yīng)用AI時(shí),這一趨勢將愈發(fā)明顯。
訓(xùn)練大型語言模型(LLM)、實(shí)施數(shù)據(jù)多副本策略、延長數(shù)據(jù)保留周期均是AI戰(zhàn)略中的關(guān)鍵要素,
而這些要素的成功實(shí)施均需企業(yè)加大對存儲基礎(chǔ)設(shè)施的投資力度。
參考資料:Klaassen, M. (2025, January 10). AI adoption will impact corporate storage requirements. Recon Analytics. https://reconanalytics.com/impact-of-ai-on-corporate-storage-requirements/
本文轉(zhuǎn)載自??Andy730??,作者:常華Andy
