為什么人工智能管理數(shù)據(jù)中心需要一段時(shí)間
雖然超大規(guī)模企業(yè)已經(jīng)使用人工智能來改善運(yùn)營,但大多數(shù)其他數(shù)據(jù)中心的集成度還不夠高,無法使其發(fā)揮作用。
數(shù)據(jù)中心管理的工作正在迅速變化。有混合環(huán)境和多云需要處理、邊緣計(jì)算以及快速發(fā)展的網(wǎng)絡(luò)安全威脅的持續(xù)沖擊。
人工智能承諾解決他們所面臨的所有復(fù)雜問題。自學(xué)習(xí)系統(tǒng)將自行適應(yīng)快速發(fā)展的環(huán)境,抵御已知和未知威脅,以超人的準(zhǔn)確性即時(shí)響應(yīng),并且以低廉的成本完成所有工作。
由于孤立的系統(tǒng)和缺乏集成管理平臺(tái),目前還沒有,而且可能不會(huì)持續(xù)很長時(shí)間。
安永咨詢服務(wù)董事總經(jīng)理AmrAhmed表示,數(shù)據(jù)中心的復(fù)雜性呈指數(shù)級(jí)增長。過去,一家公司可能只有一臺(tái)大型機(jī)。然后,有了客戶端-服務(wù)器,環(huán)境增長到數(shù)十、數(shù)百或數(shù)千臺(tái)機(jī)器,他說。“分布式環(huán)境——數(shù)十萬;虛擬化——數(shù)百萬;云——數(shù)千萬。”這超出了人類的管理能力。“人工智能是必不可少的,”他告訴DCK。“沒有辦法解決它。這不是一種選擇。它不是可選的。”
最大的云提供商,超大規(guī)模者,已經(jīng)將機(jī)器學(xué)習(xí)(一種人工智能)應(yīng)用于這個(gè)規(guī)模問題已經(jīng)有一段時(shí)間了。“預(yù)測故障、自動(dòng)轉(zhuǎn)移工作負(fù)載——這些事情不會(huì)在未來十年內(nèi)發(fā)生,”他說。“它已經(jīng)存在。云服務(wù)提供商已經(jīng)在他們的云環(huán)境中使用它。這就是他們可以大規(guī)模提供服務(wù)的方式。”
多年來,特別是在數(shù)據(jù)中心電力和冷卻領(lǐng)域,高級(jí)分析已被用于降低能源成本。“有許多工具可以分析這些數(shù)據(jù)并做出決策,”艾哈邁德說。
當(dāng)人工智能可以幫助提高數(shù)據(jù)中心的正常運(yùn)行時(shí)間時(shí),這是一個(gè)明顯而明顯的好處——也是大型數(shù)據(jù)中心運(yùn)營商關(guān)注的一個(gè)重要領(lǐng)域。Capgemini人工智能和分析副總裁DanSimion表示,人工智能和機(jī)器學(xué)習(xí)可用于預(yù)測關(guān)鍵任務(wù)的失敗,并避免意外的系統(tǒng)和服務(wù)故障或數(shù)據(jù)中心中斷。“這種方法創(chuàng)造了一種自我修復(fù)機(jī)制,”他告訴DCK。
他補(bǔ)充說,雖然大型數(shù)據(jù)中心供應(yīng)商在這方面處于領(lǐng)先地位,但高科技公司也可能會(huì)從頭開始構(gòu)建這類人工智能系統(tǒng),如果它在他們的駕駛室里。
他說,數(shù)字化程度最高的公司已經(jīng)從他們的人工智能投資中看到了價(jià)值,擁有大型數(shù)據(jù)中心的公司也是如此。
人工智能需要態(tài)勢感知
對于較小的數(shù)據(jù)中心,開始部署人工辭退的最簡單方法是依賴技術(shù)供應(yīng)商。但是,這種方法存在局限性,即難以處理相互依賴和業(yè)務(wù)環(huán)境。
為了發(fā)揮最大的作用,人工智能需要態(tài)勢感知。對于僅限于單個(gè)供應(yīng)商的產(chǎn)品及其功能的人工智能系統(tǒng)來說,這是很難做到的。
“當(dāng)我看到我的網(wǎng)絡(luò)、我的計(jì)算或電源使用量激增時(shí),這可能與我的勞動(dòng)力變化有關(guān),”艾哈邁德說。例如,更多的人可以在家工作。這可能是由于正在推出重大平臺(tái)升級(jí)-或者是一些邪惡的事情。“添加該業(yè)務(wù)環(huán)境為復(fù)雜性增加了第三個(gè)維度。”
大多數(shù)供應(yīng)商仍處于將人工智能和機(jī)器學(xué)習(xí)功能添加到單個(gè)產(chǎn)品的早期階段。例如,產(chǎn)品可能會(huì)提供異?;顒?dòng)的警報(bào)(機(jī)器學(xué)習(xí)最常見的用例之一),但除此之外沒有其他太多。更高級(jí)的供應(yīng)商可以提供預(yù)測分析、行動(dòng)建議,甚至自動(dòng)修復(fù)問題。
一種更全面、更有效的人工智能方法是領(lǐng)域不可知的,從所有系統(tǒng)中提取數(shù)據(jù)。在大多數(shù)情況下,實(shí)現(xiàn)這種能力還處于早期階段。
首先,通常存在組織障礙。“這一切都在孤島中,”艾哈邁德說。“有網(wǎng)絡(luò)團(tuán)隊(duì),有管理這個(gè)的基礎(chǔ)設(shè)施團(tuán)隊(duì),還有管理它的運(yùn)營團(tuán)隊(duì)。將它們整合在一起并使用AI和ML來理解它需要時(shí)間。”
在單個(gè)系統(tǒng)上部署人工智能工具更簡單,但一些組織開始采用更集中的方法。“他們正在改變他們的運(yùn)作方式,”他說。
盡早打好基礎(chǔ)
有遠(yuǎn)見的數(shù)據(jù)中心經(jīng)理在設(shè)計(jì)他們的系統(tǒng)時(shí)考慮到了人工智能。
一個(gè)有吸引力的用例是預(yù)測設(shè)備何時(shí)可能會(huì)提前損壞,以便在它導(dǎo)致數(shù)據(jù)中心宕機(jī)之前對其進(jìn)行修復(fù)或更換。
美國主要數(shù)據(jù)中心提供商QTSRealtyTrust的產(chǎn)品首席技術(shù)官BrentBensten表示:“供應(yīng)商都在談?wù)撊斯ぶ悄芑驒C(jī)器學(xué)習(xí)的這種必殺技,以預(yù)測何時(shí)會(huì)發(fā)生故障。”
此功能需要跨不同系統(tǒng)的整體視圖,而這種視圖仍然很難獲得。要確定設(shè)備何時(shí)可能發(fā)生故障,您可能需要溫度數(shù)據(jù)、利用率歷史記錄、功耗數(shù)據(jù)等。
Bensten說,“孤立讓事情變得困難,直到你可以將系統(tǒng)與其他系統(tǒng)融合在一起,讓它們變得更智能,人工智能和機(jī)器學(xué)習(xí)才會(huì)變得強(qiáng)大。這就是我的觀點(diǎn)。”
在過去四年中,QTS一直在投資于統(tǒng)一平臺(tái)以滿足其基礎(chǔ)設(shè)施管理需求。他說。“我們把它們?nèi)磕脕恚阉鼈兒隙鵀橐?,然后我們就可以在它上面做人工智能和機(jī)器學(xué)習(xí)。”