企業(yè)多云管理:在技術(shù)、人員、流程方面面臨的挑戰(zhàn)
雖然云計(jì)算已經(jīng)以某種形式出現(xiàn)了十多年,但從私有、本地或公共位置管理其當(dāng)前企業(yè)迭代的工具仍在快速發(fā)展。Gartner 表示,包括 IBM/Red Hat、VMware、CloudBolt、Flexera、Scalr、Cisco 和 Nutanix 在內(nèi)的 90 多家供應(yīng)商提供不同程度的云管理功能。
VMware 云管理業(yè)務(wù)部產(chǎn)品營(yíng)銷(xiāo)副總裁 Roy Ritthaler 表示,雖然有很多選擇,但企業(yè)很難有效地管理多云環(huán)境。
Ritthaler 表示,“由于工作負(fù)載部署在多個(gè)公共云、多云 Kubernetes、私有云/數(shù)據(jù)中心和邊緣位置,大多數(shù)企業(yè)發(fā)現(xiàn)很難統(tǒng)一了解其環(huán)境的健康狀況以及管理成本、確保安全性和改善運(yùn)營(yíng)治理,同時(shí)實(shí)現(xiàn)核心流程自動(dòng)化。”
這不僅是技術(shù)挑戰(zhàn),也是人員和流程的挑戰(zhàn)。缺乏統(tǒng)一的供應(yīng)工具、孤立的運(yùn)營(yíng)可見(jiàn)性、缺乏整體性能和成本洞察力以及互操作性和集成問(wèn)題意味著孤立的資源、分散的團(tuán)隊(duì)和管理工具的擴(kuò)散。涉及多個(gè)角色——IT 運(yùn)營(yíng)、DevOps/開(kāi)發(fā)人員、財(cái)務(wù)和業(yè)務(wù)線 (LOB) 領(lǐng)導(dǎo)者——在企業(yè)采用云模型時(shí)需要廣泛的培訓(xùn)、協(xié)作和流程變更。
IDC 研究發(fā)現(xiàn),大多數(shù)企業(yè)預(yù)計(jì)他們將需要全新的多云管理工具來(lái)滿足他們新興的業(yè)務(wù)和基礎(chǔ)設(shè)施運(yùn)營(yíng)需求。
“隨著開(kāi)發(fā)人員和業(yè)務(wù)組實(shí)施最符合其應(yīng)用程序和業(yè)務(wù)創(chuàng)新路線圖的云服務(wù)和工具,而對(duì)企業(yè)偏好的考慮有限,多云架構(gòu)正在引入新一波的管理復(fù)雜性。容器、微服務(wù)和 Kubernetes 的引入進(jìn)一步增加了復(fù)雜性。” IDC 表示。
據(jù) IDC 稱(chēng),未來(lái)兩年,企業(yè)決策者預(yù)計(jì)將優(yōu)先投資于分析、性能監(jiān)控和報(bào)告、容量?jī)?yōu)化、成本管理以及自動(dòng)化和自助服務(wù),以增強(qiáng)多云和治理的管理能力。
這些管理工具緊密相連。成本決策必須根據(jù)容量需求和應(yīng)用程序性能進(jìn)行決策。
企業(yè)也對(duì)跨越不同云提供商的應(yīng)用程序開(kāi)發(fā)密度感到焦慮。
企業(yè)管理協(xié)會(huì)(Enterprise Management Associates)的一項(xiàng)研究表明,有 2316 個(gè)與 AWS、Azure 和 Google Cloud 相關(guān)的 Python 庫(kù),開(kāi)發(fā)人員每天下載大約 1300 萬(wàn)次到 112 個(gè)不同的(主要是基于 Linux 的)操作系統(tǒng)。
“雖然單個(gè)項(xiàng)目通常位于單個(gè)云的邊界內(nèi),但 EMA 也看到越來(lái)越多(約 10%)的項(xiàng)目跨越多個(gè)云。微服務(wù)的快速增長(zhǎng)加劇了這一趨勢(shì),同時(shí)強(qiáng)調(diào)了開(kāi)發(fā)人員和 IT 運(yùn)營(yíng)商迫切需要統(tǒng)一的治理和管理層,以同時(shí)為優(yōu)化發(fā)布效率和運(yùn)營(yíng)可靠性做出貢獻(xiàn),”EMA 表示。
如此廣泛的項(xiàng)目導(dǎo)致許多客戶尋求幫助來(lái)管理跨多個(gè)環(huán)境的工作負(fù)載,這需要多個(gè)控制臺(tái)和工具。
隨著企業(yè)管理多云環(huán)境以及控制臺(tái)和工具數(shù)量的增長(zhǎng),遇到來(lái)自孤立數(shù)據(jù)的挑戰(zhàn)是很常見(jiàn)的,這是將運(yùn)行在遺留系統(tǒng)上的應(yīng)用程序遷移到不同的云環(huán)境中不可避免的常見(jiàn)副作用。
根據(jù)IBM的研究,隨著企業(yè)將斷開(kāi)連接的數(shù)據(jù)從一個(gè)云遷移到另一個(gè)云以供各種應(yīng)用程序使用,他們經(jīng)常會(huì)遇到性能問(wèn)題,并且成本會(huì)顯著增加,甚至高達(dá) 300%。
部分用戶也會(huì)抱怨多云服務(wù),稱(chēng)由于云之間的數(shù)據(jù)傳輸和 IT 人員增加,使他們的成本大幅增加。
1. 在云之間獲得統(tǒng)一的視圖
隨著企業(yè)遷移到多個(gè)云,他們很快發(fā)現(xiàn)每個(gè)云提供商都是獨(dú)一無(wú)二的,這增加了管理這些環(huán)境的挑戰(zhàn),例如網(wǎng)絡(luò)架構(gòu)、功能和規(guī)模,這為客戶在云中操作和給數(shù)據(jù)中心和校園網(wǎng)絡(luò)等現(xiàn)有環(huán)境帶來(lái)了運(yùn)營(yíng)挑戰(zhàn)。
以 Arista 為例,該公司提供 CloudEOS 和 CloudVision 軟件,這些軟件支持私有云或公共云之間的網(wǎng)絡(luò)連接和管理功能。
借助 CloudEOS,客戶可以使用針對(duì)所有網(wǎng)絡(luò)抽象的一致操作模型來(lái)操作多個(gè)公共云——使用它們用來(lái)操作現(xiàn)有數(shù)據(jù)中心和園區(qū)網(wǎng)絡(luò)的相同運(yùn)行手冊(cè)和流程。“CloudEOS 遙測(cè)技術(shù)與 CloudVision 相結(jié)合,可提供給客戶多云網(wǎng)絡(luò)網(wǎng)絡(luò)狀態(tài)的時(shí)間序列存儲(chǔ)和分析,這讓客戶可以回過(guò)頭來(lái)檢查問(wèn)題發(fā)生的原因和方式,并減少恢復(fù)運(yùn)營(yíng)的時(shí)間,同時(shí)對(duì)初始故障檢測(cè)進(jìn)行快速的根本原因分析?!?/p>
在成本方面,單獨(dú)的 Arista 產(chǎn)品 - CloudEOS Edge - 支持網(wǎng)絡(luò)邊緣的動(dòng)態(tài)路徑選擇,允許客戶為應(yīng)用程序分配路徑以降低數(shù)據(jù)傳輸/同步成本。通過(guò)跨數(shù)據(jù)中心、園區(qū)和多個(gè)公共云的統(tǒng)一 EOS 和 CloudVision 部署,客戶可以支持和管理他們的多云戰(zhàn)略,而不會(huì)將他們的團(tuán)隊(duì)規(guī)模擴(kuò)大太多或影響他們的預(yù)算計(jì)劃。
2. 故障排除
在管理多云環(huán)境時(shí),企業(yè)面臨的另一個(gè)問(wèn)題是區(qū)分應(yīng)用程序性能問(wèn)題和網(wǎng)絡(luò)問(wèn)題。
企業(yè)往往很難準(zhǔn)確預(yù)測(cè)新配置的云服務(wù)對(duì)網(wǎng)絡(luò)的影響。
其實(shí),IT 和 DevOps 團(tuán)隊(duì)可以一起工作,使用共享詞匯來(lái)查明應(yīng)用程序退化的根本原因,主動(dòng)實(shí)時(shí)預(yù)防問(wèn)題,設(shè)置策略,并自動(dòng)響應(yīng)以解決本地或云中的應(yīng)用程序問(wèn)題。
由于缺乏信息和可見(jiàn)性,大多數(shù)企業(yè)發(fā)現(xiàn)在公共云中排除網(wǎng)絡(luò)問(wèn)題非常困難,尤其是在故障排除需要數(shù)據(jù)包級(jí)別的可觀察性時(shí),應(yīng)用程序和網(wǎng)絡(luò) IT 人員一起工作,使多云工作更有效,但目前大多數(shù)企業(yè)還沒(méi)有做到這一點(diǎn)。
3. 來(lái)自 AI/ML 的幫助
將來(lái)自物理本地部署和多個(gè)云的數(shù)據(jù)拼接在一起并對(duì)其應(yīng)用分析是一項(xiàng)挑戰(zhàn),但這是管理這種環(huán)境的關(guān)鍵。
部分提供機(jī)器學(xué)習(xí)和人工智能驅(qū)動(dòng)的云管理平臺(tái),可以簡(jiǎn)化網(wǎng)絡(luò)基礎(chǔ)設(shè)施設(shè)備的入職、配置、監(jiān)控、管理、故障排除、報(bào)警和報(bào)告。
在多云環(huán)境中,在本地和跨多個(gè)云環(huán)境中同樣運(yùn)行良好的解決方案是獲得全面可見(jiàn)性和消除孤島的關(guān)鍵。部分解決方案測(cè)量應(yīng)用程序的可用性和性能,自動(dòng)化操作以快速?gòu)膽?yīng)用程序或網(wǎng)絡(luò)性能問(wèn)題中恢復(fù),并提供可見(jiàn)性和工具來(lái)診斷和修復(fù)問(wèn)題,以免影響運(yùn)營(yíng)或最終用戶對(duì)應(yīng)用程序環(huán)境的體驗(yàn)。
當(dāng)然,管理多云世界還面臨其他挑戰(zhàn)。
企業(yè)需要使員工具備管理多供應(yīng)商產(chǎn)品的技能。數(shù)據(jù)格式和 API 是不同的,企業(yè)需要一個(gè)能夠理解所有這些事情的團(tuán)隊(duì)。
IDC 表示,容器、微服務(wù)和 Kubernetes 的引入進(jìn)一步增加了復(fù)雜性。
從多云管理組合中獲得收益需要企業(yè)做出權(quán)衡和戰(zhàn)略投資選擇。在快速發(fā)展的技術(shù)環(huán)境中,很難完全預(yù)測(cè)新流程、方法和工具的影響。