偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

聊聊基線預(yù)警的局限性

運(yùn)維
雖然大家都用基線預(yù)警,不過大家關(guān)注的基線指標(biāo)與閾值都存在較大的差異。因?yàn)殡m然大家使用的數(shù)據(jù)庫的種類相同,但是大家的系統(tǒng)都存在較大的差異。具體用哪些指標(biāo)來做預(yù)警,以及設(shè)定什么樣的閾值,這是十分個(gè)性化的。

?基線預(yù)警數(shù)據(jù)庫運(yùn)維監(jiān)控中的重要手段之一,通過基線發(fā)現(xiàn)系統(tǒng)中某些指標(biāo)存在的不合理波動(dòng),進(jìn)而提前預(yù)警,是一種數(shù)據(jù)庫運(yùn)維監(jiān)控中最為常用的手段,也是目前大多數(shù)企業(yè)正在使用的主要監(jiān)控方案。

雖然大家都用基線預(yù)警,不過大家關(guān)注的基線指標(biāo)與閾值都存在較大的差異。因?yàn)殡m然大家使用的數(shù)據(jù)庫的種類相同,但是大家的系統(tǒng)都存在較大的差異。具體用哪些指標(biāo)來做預(yù)警,以及設(shè)定什么樣的閾值,這是十分個(gè)性化的。實(shí)際上一個(gè)能夠真正起作用的基線預(yù)警系統(tǒng),里面都包含了大量的運(yùn)維經(jīng)驗(yàn)。

圖片

以每秒讀時(shí)間這個(gè)指標(biāo)為例,我們可以看出其取值范圍波動(dòng)是較大的,并且沒有明顯的聚集特性,此類指標(biāo)我們?cè)撊绾卧O(shè)置基線呢?確實(shí)也是有些頭疼的事情。

圖片

再來看看另外一個(gè)數(shù)據(jù)庫的共享緩存區(qū)命中率,其點(diǎn)的集中度還是比較集中,但是還是存在散落分布的,差異很大的值。這些值要不要告警呢?告警對(duì)我們的運(yùn)維有什么意義呢?也真的說不清楚。而且如果我們運(yùn)維數(shù)百套,甚至上千套類似的數(shù)據(jù)庫系統(tǒng),我們也無法對(duì)這些數(shù)據(jù)庫系統(tǒng)設(shè)置合理的基線閾值。如果不去做個(gè)性化的設(shè)置,那么基線告警就不準(zhǔn)確,運(yùn)維告警工作陷入了兩難的境地。

圖片

可能有朋友會(huì)說,干嘛不用動(dòng)態(tài)基線或者智能基線。確實(shí)動(dòng)態(tài)基線可以避免上面說的問題,但是動(dòng)態(tài)基線就一定有意義嗎?我們來看上面有一個(gè)嚴(yán)重的IO LATCNCY基線告警。

圖片

IO延時(shí)出現(xiàn)了較為嚴(yán)重的波動(dòng),但是這有代表了什么含義呢?要不要發(fā)短信告警呢?運(yùn)維人員收到短信要不要去處置呢?要不要對(duì)這個(gè)告警做閉環(huán)管理呢?我們還是搞不清楚,運(yùn)維告警的意義一方面是發(fā)現(xiàn)系統(tǒng)的隱患,另外一方面是在系統(tǒng)出現(xiàn)嚴(yán)重故障前提前警示。似乎這個(gè)被標(biāo)稱為“嚴(yán)重”的基線告警,對(duì)我們運(yùn)維的幫助也沒有那么大。

從上面的例子我們看到了基線告警的局限性,簡(jiǎn)單的單一指標(biāo)異常為核心的基線告警并不能預(yù)示某類故障的發(fā)生,因此基線告警對(duì)于運(yùn)維的作用就大大降低了。對(duì)基線告警進(jìn)行簡(jiǎn)單的升級(jí),通過規(guī)則引擎構(gòu)建故障模型,會(huì)有更好的效果。比如剛才的這個(gè)通過動(dòng)態(tài)基線產(chǎn)生的IO延時(shí)基線異常,如果再疊加一些其他的條件,就可以構(gòu)建出一個(gè)更有指向性的告警出來。比如IO延時(shí)基線異常,同時(shí)操作系統(tǒng)出現(xiàn)大量的IO方面的告警,或者出現(xiàn)多路徑鏈路切換,這樣的告警其指向性就更強(qiáng)了,而且告警的價(jià)值也大大提高了。

從另外一個(gè)角度來看,IO延時(shí)基線異常,同時(shí)IO吞吐量也大幅提高,某條關(guān)鍵SQL的執(zhí)行時(shí)間也變長(zhǎng)了,這種告警也更具有價(jià)值。也更值得做閉環(huán)管理。

通過故障模型替代基線告警,還有一個(gè)好處,那就是告警的指向性更強(qiáng),因此當(dāng)告警發(fā)生時(shí),診斷問題的原因也變得簡(jiǎn)單了很多,因?yàn)閱我恢笜?biāo)異常的可能原因過于復(fù)雜,大多數(shù)情況下讓人無法入手分析。而故障模型疊加了很多其他因素,因此故障的指向性也更強(qiáng)了,分析問題的時(shí)候也就更容易了。這也是現(xiàn)在D-SMART的基線告警并不推送到告警臺(tái),而用故障模型告警替代的主要原因。?

責(zé)任編輯:武曉燕 來源: 白鱔的洞穴
相關(guān)推薦

2021-08-09 11:07:44

數(shù)據(jù)安全算法互聯(lián)網(wǎng)

2018-04-26 13:41:57

深度學(xué)習(xí)人工智能機(jī)器學(xué)習(xí)

2010-08-26 10:57:35

2022-06-16 12:51:48

工業(yè)機(jī)器人機(jī)器人

2023-01-10 10:11:50

GPU計(jì)算

2021-04-20 08:31:13

Kubernetes局限性容器

2019-11-06 11:34:53

人工智能機(jī)器學(xué)習(xí)工具

2017-07-12 10:00:22

深度學(xué)習(xí)小數(shù)據(jù)樣本深度網(wǎng)絡(luò)

2017-07-25 11:22:06

2017-10-09 19:12:52

AI深度學(xué)習(xí)局限性

2010-08-06 11:04:11

RIP路由協(xié)議

2024-06-05 13:48:04

2024-11-25 17:03:17

2017-07-11 15:25:53

深度學(xué)習(xí)人工智能

2023-04-12 10:51:42

2014-08-20 10:20:18

2010-01-12 15:04:01

VB.NET異常處理

2022-10-19 08:19:32

動(dòng)態(tài)基線預(yù)警

2013-08-14 09:39:04

Hyper-VSCSI磁盤

2023-06-16 10:18:22

人工智能商業(yè)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)