HP服務(wù)器故障排除實(shí)戰(zhàn)
網(wǎng)絡(luò)技術(shù)飛速發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)被廣泛應(yīng)用于學(xué)校、科研部門、政府機(jī)關(guān)及商業(yè)等各個(gè)領(lǐng)域。網(wǎng)絡(luò)管理的好壞將直接影響網(wǎng)絡(luò)的有效使用,其中對(duì)于服務(wù)器的安全維護(hù)十分重要。服務(wù)器的管理維護(hù)包括軟件和硬件兩個(gè)方面,哪一方面出問(wèn)題都會(huì)讓服務(wù)器運(yùn)行出現(xiàn)故障甚至癱瘓。下面就給大家說(shuō)一說(shuō)本人在實(shí)際中遇到的一次HP服務(wù)器故障排除。
HP服務(wù)器故障排除一、出現(xiàn)故障
筆者單位使用的是HP NetServer LH3000服務(wù)器組成的局域網(wǎng),自從建網(wǎng)以來(lái)服務(wù)器硬件一直良好。但有一次啟動(dòng)服務(wù)器后發(fā)現(xiàn)有問(wèn)題,剛開(kāi)始自檢運(yùn)行都正常,等到進(jìn)入Windows2000主畫面時(shí),發(fā)現(xiàn)服務(wù)器主機(jī)內(nèi)的噪音變大,開(kāi)始認(rèn)為是系統(tǒng)軟件加載錯(cuò)誤導(dǎo)致的,多次重新啟動(dòng)服務(wù)器,有時(shí)重啟后正常維持時(shí)間稍長(zhǎng),有時(shí)稍短。等到系統(tǒng)啟動(dòng)完畢后,注冊(cè)進(jìn)入系統(tǒng),打開(kāi)管理工具,查看系統(tǒng)日志,沒(méi)有發(fā)現(xiàn)故障提示。
HP服務(wù)器故障排除二、故障的排除
于是我們懷疑是感染了病毒,把服務(wù)器設(shè)置成從軟盤驅(qū)動(dòng)器啟動(dòng),用KV3000殺毒王引導(dǎo)盤啟動(dòng)服務(wù)器,之后掃描硬盤,查完后未發(fā)現(xiàn)病毒,排除了病毒感染的可能性。又懷疑與BIOS有關(guān)?檢查BIOS設(shè)置,查出版本號(hào),到惠普網(wǎng)站查詢,找到了對(duì)應(yīng)的新BIOS版本,于是決定升級(jí)BIOS試一試。先到惠普網(wǎng)站下載了***的BIOS升級(jí)程序,拷貝到軟盤,為了保險(xiǎn),先將服務(wù)器現(xiàn)在的BIOS備份后再升級(jí)。從軟盤引導(dǎo)系統(tǒng),運(yùn)行升級(jí)程序,大約25分鐘之后,升級(jí)終于順利完成。再啟動(dòng)進(jìn)入BIOS設(shè)置,改為硬盤啟動(dòng)。重啟服務(wù)器,進(jìn)入系統(tǒng)后,過(guò)了一會(huì)兒,故障依舊。至此,我們才轉(zhuǎn)向服務(wù)器的硬件檢查,打開(kāi)了機(jī)箱,檢查電源風(fēng)扇,運(yùn)轉(zhuǎn)正常,粗略檢查其它風(fēng)扇也未見(jiàn)異常。***請(qǐng)HP專業(yè)維護(hù)人員來(lái),并將系統(tǒng)I/O控制板和電源控制板予以更換,更換重啟服務(wù)器后,問(wèn)題仍未解決。于是開(kāi)始全面檢查服務(wù)器,在服務(wù)器面板主菜單中查看,意外發(fā)現(xiàn)“Event Log”中的“System Event”下有一提示,顯示“Fan Slow”。于是我們重新打開(kāi)機(jī)箱,認(rèn)真檢查每組風(fēng)扇,由于服務(wù)器內(nèi)部有多組風(fēng)扇,各自負(fù)責(zé)不同控制板的散熱。分別檢查,終于在機(jī)器隔板下的隱蔽處找到兩組風(fēng)扇,其中有一組風(fēng)扇停轉(zhuǎn)。原因找到后,換上新風(fēng)扇再啟動(dòng)服務(wù)器,聲音小了。運(yùn)行一切正常。至此服務(wù)器故障得以排除。
HP服務(wù)器故障排除三、故障排除分析
從以上故障排除過(guò)程得知,HP NetServer LH3000服務(wù)器的面板日志記錄中記載著系統(tǒng)每次啟動(dòng)和關(guān)閉時(shí)的硬件檢測(cè)信息,如果系統(tǒng)出現(xiàn)故障,我們可以直接查看系統(tǒng)事件,以便快速診斷故障部位,這將起到事半功倍的作用。現(xiàn)將HPNetServer LH3000服務(wù)器面板的主要內(nèi)容簡(jiǎn)單介紹一下:
Event Log
Fw lnfo:主要是一些設(shè)備信息,如BIOS版本號(hào)等。
System lnfo:主要是硬件信息,如CPU主頻、型號(hào)、CPU號(hào)(多處理器)、L2Cache、內(nèi)存容量及所在插槽等。
Component lnfo:主要是產(chǎn)品標(biāo)號(hào)、序列號(hào)等。
Service:記錄一些服務(wù)信息。
Adjust Contrast:調(diào)整面板顯示的對(duì)比度。
按面板右側(cè)的上下箭頭,選擇進(jìn)入子菜單;當(dāng)光標(biāo)處于“Event Log”時(shí)回車進(jìn)入,選擇“System Event”再進(jìn)入,即顯示系統(tǒng)引導(dǎo)、死機(jī)、管理、硬件故障信息等內(nèi)容。通過(guò)查看記錄即可知道異常情況的原因及時(shí)間等信息,為解決問(wèn)題提供依據(jù)。
HP服務(wù)器故障排除四、經(jīng)驗(yàn)總結(jié)
HP服務(wù)器出現(xiàn)噪音變大的故障,初期可能只是風(fēng)扇轉(zhuǎn)速減慢,系統(tǒng)還能繼續(xù)工作,但由于系統(tǒng)負(fù)荷逐漸加大,環(huán)境溫度升高,使服務(wù)器內(nèi)部溫度升高,加大了風(fēng)扇的負(fù)荷,最終導(dǎo)致一組風(fēng)扇損壞,將排風(fēng)散熱的工作由另一組風(fēng)扇負(fù)擔(dān),系統(tǒng)初始啟動(dòng)時(shí),系統(tǒng)產(chǎn)生熱量較小,一組風(fēng)扇還可以承擔(dān)。當(dāng)系統(tǒng)運(yùn)行一段時(shí)間后,機(jī)箱內(nèi)溫度開(kāi)始升高,當(dāng)系統(tǒng)檢測(cè)到溫度已超過(guò)其閾值時(shí),于是發(fā)出指令提高風(fēng)扇轉(zhuǎn)速,加速散熱,從而導(dǎo)致服務(wù)器主機(jī)內(nèi)的聲音突然加大。如果各組風(fēng)扇都運(yùn)行正常,則可以保證服務(wù)器主機(jī)內(nèi)的溫度在正常范圍內(nèi),從而保證系統(tǒng)正常運(yùn)行。
在檢查服務(wù)器的硬件問(wèn)題時(shí),***先查看服務(wù)器面板主菜單“Event Log”的內(nèi)容。由于服務(wù)器事件存儲(chǔ)容量有限,應(yīng)定期備份記錄,否則溢出后新事件將無(wú)法記錄,會(huì)導(dǎo)致系統(tǒng)實(shí)時(shí)信息丟失,不利于排查故障。建議用Navigator CD制作DiagTools啟動(dòng)軟盤,需兩張軟盤。定期用軟盤啟動(dòng)服務(wù)器,啟動(dòng)后回車,即選擇Diagtools和Event Log Display Utility Ver 3.12,進(jìn)入Event Log Display Utility Ver 3.12,即可導(dǎo)出Event Log記錄;否則按“ESC”,只有Diagtools不能導(dǎo)出事件日志。還可以通過(guò)Diagtools工具檢查系統(tǒng),保證系統(tǒng)的安全。
【編輯推薦】


















