偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

通過滴滴技術(shù)博客:探尋造成此次P0故障的真正原因

新聞
雖然滴滴有能力基于K8S二次開發(fā),但是由于版本跨度較大,細(xì)節(jié)點(diǎn)較多,原地升級風(fēng)險我覺得比替換升級 大不少。比如集群版本已經(jīng)升級為1.20,但是Node節(jié)點(diǎn)的kubelet的版本還是 1.12,如果api不兼容,那么這個影響是非常大的,集群回滾又沒有那么快。

2023年11月27日晚至2023年11月28日早晨,滴滴發(fā)生了長達(dá)12小時的P0級故障,導(dǎo)致滴滴核心業(yè)務(wù)都受到了影響,比如不顯示定位無法打車、滴滴單車無法掃碼等問題,期間滴滴進(jìn)行了多次致歉。

圖片圖片

                       來源:https://weibo.com/2838754010/NuMAAaUEl

目前問題故障已經(jīng)恢復(fù),根據(jù)最新的消息得知造成此次事故的原因,是由于升級K8S 集群導(dǎo)致。

圖片圖片

1. 集群體量大

最大集群規(guī)模已經(jīng)遠(yuǎn)遠(yuǎn)超出了社區(qū)推薦的5千個 node 上限,有問題的爆炸半徑大。

圖片圖片

2. 版本升級跨度大

直接從1.12 升級到了1.20,跨越多個版本,有可能存在api不兼容的問題。

3. 升級方式應(yīng)該選擇了原地升級

雖然滴滴有能力基于K8S二次開發(fā),但是由于版本跨度較大,細(xì)節(jié)點(diǎn)較多,原地升級風(fēng)險我覺得比替換升級大不少。

比如集群版本已經(jīng)升級為1.20,但是Node節(jié)點(diǎn)的kubelet的版本還是 1.12,如果api不兼容,那么這個影響是非常大的,集群回滾又沒有那么快。

圖片圖片

至于為什么采用原地升級方案,估計(jì)還有很多細(xì)節(jié)我們不得而知,但是此種方式確實(shí)有點(diǎn)激進(jìn),船大不好掉頭。

責(zé)任編輯:武曉燕 來源: 架構(gòu)成長指南
相關(guān)推薦

2023-12-05 09:46:30

2020-04-09 10:43:12

長事務(wù)P0故障

2021-08-05 06:46:39

P0故障公司

2025-01-17 12:03:24

2010-01-06 09:57:34

華為交換機(jī)故障

2013-02-25 10:48:53

RubyWeb

2023-06-07 07:27:32

唯品會冷凍系統(tǒng)故障

2022-03-13 22:50:47

P0故障HBase

2025-03-10 08:20:53

代碼線程池OOM

2023-03-06 18:34:44

存貨庫存模型

2025-01-17 13:38:30

支付寶P0事故

2021-04-30 07:09:48

SQLP0事故

2021-01-28 09:48:39

UPS電源數(shù)據(jù)中心

2009-12-23 09:37:38

集線器故障

2011-06-28 16:18:37

網(wǎng)站收錄

2015-04-17 10:12:58

光纖光纖衰減光纖損耗

2010-08-02 16:51:54

2020-06-04 08:03:37

MySQL事故P0

2010-07-28 10:21:44

統(tǒng)一計(jì)算

2022-10-17 08:31:03

生產(chǎn)環(huán)境P0項(xiàng)目
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號