偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Kubernetes探針踩坑記

云計算
最近一兩個月生產(chǎn)K8s集群頻繁出現(xiàn)短時503 Service Temporarily Unavailable,還不能主動復現(xiàn),相當郁悶,壓力山大。

[[342084]]

本文轉(zhuǎn)載自微信公眾號「Dotnet Plus」,可以通過以下二維碼關注。轉(zhuǎn)載本文請聯(lián)系Dotnet Plus公眾號。

1. 荒腔走板

最近一兩個月生產(chǎn)K8s集群頻繁出現(xiàn)短時503 Service Temporarily Unavailable,還不能主動復現(xiàn),相當郁悶,壓力山大。

 

HTTP 5xx響應狀態(tài)碼用于定義服務端錯誤。

  • 500 Internal Server Error:所請求的服務器遇到意外的情況并阻止其執(zhí)行請求,通常針對單個請求,整個站點有時還是提供服務。
  • 502 Bad Gateway Error 暗示連接鏈路中某個服務器下線或者不可用;
  • 503 Service Unavailable 意味著托管您的應用程序的實際Web服務器上存在問題。

2. 排查記錄

 

  • 基本上每隔2-3天出現(xiàn)一次,每次2-3分鐘,此時整站503;
  • 因為不能主動復現(xiàn),8月26日排查相應時間段的EFK日志: impala連接問題,大數(shù)據(jù)運維同事排查到webapp發(fā)起impala的請求與impala集群時鐘未對齊,導致webapp impalaODBC Driver連不上impala集群;

進入k8s集群節(jié)點,確實部分節(jié)點的時鐘對齊服務未啟動,不定時出現(xiàn)比北京時間慢2,3分鐘的情況,這個確實可以解釋時間差導致的impala連接認證失敗。

  • 8月26日同步所有k8s節(jié)點的時鐘,之后接近一周,并未出現(xiàn)問題;
  • 9月3日又出現(xiàn)一次短時503無服務,EFK日志顯示依舊是impala連接問題,此處大數(shù)據(jù)同事未能定位具體原因,暫時定義為偶發(fā)/抖動?

 

3.思考和推演

故障現(xiàn)場每次只有impala連接問題,我也搞不懂impala連接問題竟然會導致webapp service下線。

我們的webapp兼具toB和toC業(yè)務,站點強依賴mongodb、弱依賴于impala:impala即使連不上,只是不能查,站點sso+訂單相關的寫入操作應該還可用。

回想起前幾天看到的k8s探針,糟糕,我們的就緒探針好像探測了impala

  1. // ASP.NetCore上暴露的的探測邏輯:impala && mongodb 
  2. services.AddHealthChecks() 
  3.        .AddCheck<ImpalaHealthCheck>(nameof(ImpalaHealthCheck), tags: new[] { "readyz" }) 
  4.        .AddCheck<MongoHealthCheck>(nameof(MongoHealthCheck), tags: new[] { "readyz" }); 
  5.         
  6. app.UseHealthChecks("/readyz", new HealthCheckOptions 
  7.   { 
  8.       Predicate = (check) => check.Tags.Contains("readyz"
  9.   }); 

強烈推測:就緒探針3次探測impala失敗, Pod將會被標記為Unready, 該Pod將從webapp服務負載均衡器移除, 不再分配流量,導致nginx無實際意義的后端服務,站點503。

迅速找一個beta環(huán)境,斷開impala連接,驗證猜想。

 

4.問題回顧

bugfix不是我正向推斷出來的,而是純靠經(jīng)驗推演出來的,倒不是有明確推斷思路,也算給大家提前踩坑了。

docker的健康檢查只能探測,Kubernetes存活、就緒探針不僅有探測,還有決策能力。

這里我們的k8s就緒探測使用策略出現(xiàn)了問題:

 

探測到webapp弱依賴impala有問題,就下線了整個webapp服務,應該只探測強依賴,強依賴有問題,才表明容器未就緒,這也是就緒探針的初衷。

 

責任編輯:武曉燕 來源: Dotnet Plus
相關推薦

2021-10-28 19:10:02

Go語言編碼

2017-05-05 08:12:51

Spark共享變量

2021-09-03 11:15:18

場景sql配置

2022-01-07 11:48:59

RabbitMQGolang 項目

2015-09-07 10:15:53

移動端開發(fā)

2020-09-10 13:51:48

Kubernetes云原生容器

2020-03-16 13:16:48

Kubernetes選型踩坑

2023-01-18 23:20:25

編程開發(fā)

2023-12-27 06:48:49

KubernetesDevOpsHTTP

2023-02-20 08:11:04

2023-12-14 17:34:22

Kubernetes集群K8s

2024-04-10 08:39:56

BigDecimal浮點數(shù)二進制

2024-04-01 08:05:27

Go開發(fā)Java

2023-09-22 11:29:11

JavasubList

2021-05-27 22:46:00

Nacos Clien版本Nacos

2017-07-17 15:46:20

Oracle并行機制

2021-10-15 06:49:37

MySQL

2022-11-18 07:34:12

Docker項目目錄

2024-10-09 08:09:11

2025-05-27 01:55:00

MySQL數(shù)據(jù)庫工具鏈
點贊
收藏

51CTO技術棧公眾號