影響系統(tǒng)的虛擬化挑戰(zhàn)
在現(xiàn)代IT中,虛擬化是行業(yè)標(biāo)準(zhǔn)。IT管理員應(yīng)關(guān)注虛擬化挑戰(zhàn),例如無(wú)響應(yīng)虛擬機(jī)、虛擬機(jī)網(wǎng)絡(luò)延遲、巨型虛擬機(jī)、資源爭(zhēng)用和僵尸虛擬機(jī),以確保其虛擬系統(tǒng)成功運(yùn)行。否則,這些系統(tǒng)可能面臨性能低下的風(fēng)險(xiǎn),這可能會(huì)導(dǎo)致嚴(yán)重問題。
虛擬化為管理員提供了很多好處,例如專用服務(wù)器、快速部署和重新部署、更低的成本、更快的備份和更高的生產(chǎn)率。但有時(shí)候,上述挑戰(zhàn)可能會(huì)抵消這些好處。管理員必須謹(jǐn)慎地監(jiān)視其系統(tǒng),以避免系統(tǒng)過載,并且,應(yīng)采取特定策略(例如VM標(biāo)簽)來幫助緩解問題。
VM內(nèi)資源爭(zhēng)用
主要虛擬化挑戰(zhàn)之一是存儲(chǔ)陣列內(nèi)缺乏資源,這也是VM內(nèi)大多數(shù)性能問題的原因。通常,虛擬化主機(jī)具有有限的硬件資源池。因此,給定系統(tǒng)內(nèi)的每個(gè)VM必須共享這些資源。如果虛擬機(jī)生成大量IOPS請(qǐng)求,則這些虛擬機(jī)可能會(huì)淹沒存儲(chǔ)陣列。
為了解決這個(gè)問題,管理員可以將VM移動(dòng)到擁有足夠資源的存儲(chǔ)陣列以處理其VM。此外,管理員還可通過特定的性能監(jiān)視工具,查看VM所需的IOPS數(shù)量。這些工具還可以對(duì)比管理員的工作負(fù)載與其存儲(chǔ)硬件的功能。
通過監(jiān)視他們的系統(tǒng),管理員可以在出現(xiàn)性能問題之前轉(zhuǎn)移VM,并避免資源爭(zhēng)用。
無(wú)響應(yīng)VM
鎖定或無(wú)響應(yīng)VM任務(wù)會(huì)導(dǎo)致凍結(jié)VM。在某些情況下,來賓OS也可能拒絕響應(yīng),這可能導(dǎo)致管理員難以停止、重新啟動(dòng)或關(guān)閉和開啟無(wú)響應(yīng)VM。VM無(wú)響應(yīng)可能是出于多種原因,例如主機(jī)服務(wù)器上的存儲(chǔ)、網(wǎng)絡(luò)和可用資源問題。當(dāng)VM凍結(jié)時(shí),某些管理員可能會(huì)選擇通過管理程序界面終止VM進(jìn)程,但這應(yīng)該是最后的選擇。
在采取行動(dòng)前,管理員應(yīng)首先確定存在一個(gè)還是多個(gè)無(wú)響應(yīng)的VM。如果在單臺(tái)主機(jī)服務(wù)器多個(gè)VM無(wú)響應(yīng),則問題很可能是由主機(jī)服務(wù)本身引起的。如果虛擬機(jī)可通過特定接口做出響應(yīng),則管理員可以在管理程序控制臺(tái)上通過檢查日志或錯(cuò)誤消息來定位問題。
當(dāng)管理員縮小問題范圍后,他們就可以發(fā)現(xiàn)導(dǎo)致虛擬機(jī)無(wú)響應(yīng)的根本原因。如果管理員無(wú)法定位問題,則應(yīng)考慮特定任務(wù)是否導(dǎo)致主機(jī)內(nèi)的VM凍結(jié)。然后,管理員可以檢查VM及其主機(jī)系統(tǒng)的配置,以確保有足夠的資源可用。最后,管理員應(yīng)檢查其網(wǎng)絡(luò)和共享存儲(chǔ)是否支持所有VM。
虛擬機(jī)網(wǎng)絡(luò)延遲
虛擬機(jī)需要網(wǎng)絡(luò)訪問才能運(yùn)行,而延長(zhǎng)ping響應(yīng)時(shí)間等問題可能會(huì)導(dǎo)致性能問題,進(jìn)而影響管理員系統(tǒng)的運(yùn)作。為了解決虛擬機(jī)網(wǎng)絡(luò)延遲,管理員必須首先排除其系統(tǒng)中的所有LAN問題。
網(wǎng)絡(luò)擁塞(例如繁忙的反惡意軟件)通常會(huì)導(dǎo)致網(wǎng)絡(luò)延遲。管理員可能還會(huì)發(fā)現(xiàn),IP沖突以及網(wǎng)絡(luò)設(shè)備故障或配置不當(dāng)會(huì)導(dǎo)致網(wǎng)絡(luò)延遲。此外,虛擬處理器的過度使用可能會(huì)造成問題。當(dāng)主機(jī)系統(tǒng)為某些VM提供的虛擬處理器數(shù)量超過所需數(shù)量時(shí),其他VM可能沒有足夠的處理器時(shí)間。
當(dāng)管理員確定網(wǎng)絡(luò)延遲的原因,他們就可以將問題隔離到主機(jī)服務(wù)器硬件。例如,輸入/輸出系統(tǒng)配置不當(dāng)、網(wǎng)絡(luò)端口配置不正確以及VM驅(qū)動(dòng)程序過期等問題都可能導(dǎo)致網(wǎng)絡(luò)延遲。對(duì)于Windows Server環(huán)境,網(wǎng)絡(luò)延遲的常見原因來自電源計(jì)劃問題。如果電源計(jì)劃設(shè)置不正確(例如設(shè)置為平衡),可能會(huì)導(dǎo)致性能問題。管理員應(yīng)該將電源計(jì)劃設(shè)置為高性能,以減少網(wǎng)絡(luò)延遲。
巨型VM和應(yīng)用程序殺手
巨型VM運(yùn)行8個(gè)以上的vCPU和255 GB的虛擬RAM,通常管理員使用它們來運(yùn)行需要大量CPU和內(nèi)存資源的應(yīng)用程序。但是由于資源調(diào)度問題,巨型VM也可能導(dǎo)致性能問題。為了更好地管理巨型虛擬機(jī),管理員必須參考vRealize Operations(vROps)、CPU和內(nèi)存需求指標(biāo)以對(duì)巨型虛擬機(jī)進(jìn)行調(diào)整。
此外,虛擬系統(tǒng)可能包含多個(gè)性能殺手,這些性能殺手會(huì)嚴(yán)重影響應(yīng)用程序的運(yùn)行。如果管理員遇到性能延遲,則可以采取自上而下的方法來找出問題,從應(yīng)用程序堆棧開始,然后向下移至OS堆棧、VM堆棧、ESXi堆棧,最后是基礎(chǔ)架構(gòu)。管理員找出問題后,便可以使用ESXi命令行和vROp等工具來修復(fù)性能問題。
僵尸虛擬機(jī)和VM蔓延
僵尸VM不會(huì)執(zhí)行任何有用的任務(wù),但是會(huì)消耗寶貴的系統(tǒng)資源?;旧希芾韱T在棄用一個(gè)虛擬機(jī)時(shí)會(huì)創(chuàng)建一個(gè)僵尸虛擬機(jī)。自動(dòng)化是現(xiàn)代IT的重要組成部分,管理員現(xiàn)在可以自動(dòng)創(chuàng)建大量VM。因此,管理員可能無(wú)法跟蹤系統(tǒng)中的VM,而這可能導(dǎo)致虛擬化蔓延(VM sprawl)。
跟蹤這些僵尸VM并減少VM蔓延是很困難的工作,不過,管理員可以使用VM標(biāo)簽更輕松地跟蹤VM。管理員創(chuàng)建虛擬機(jī)后,可將獨(dú)特標(biāo)簽附加到每個(gè)虛擬機(jī)上,以幫助確定虛擬機(jī)的確切用途。如果管理員在創(chuàng)建VM時(shí)沒有使用VM標(biāo)簽,則他們必須監(jiān)視整個(gè)系統(tǒng)的異常性能行為。例如,如果管理員注意到其系統(tǒng)的CPU、內(nèi)存和網(wǎng)絡(luò)內(nèi)部的性能問題,則可能表明僵尸VM和VM蔓延。
但是管理員不應(yīng)立即終止所有虛擬機(jī)。Backup Active Directory控制器和域名系統(tǒng)服務(wù)器不會(huì)一直保持活動(dòng)狀態(tài)。管理員必須密切監(jiān)視其系統(tǒng),在確定存在僵尸虛擬機(jī)后,他們應(yīng)斷開虛擬機(jī)與網(wǎng)絡(luò)的連接,并將虛擬機(jī)移動(dòng)到磁盤上來測(cè)試虛擬機(jī),以確保它們不會(huì)產(chǎn)生負(fù)面影響。





















