偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一個小需求,自動重啟k8s集群中日志不刷新的POD

云計算
日常工作中,所有項目都不是完美的,筆者就經(jīng)常遇到這種情況,pod狀態(tài)是running,但是程序卻沒有響應(yīng)。發(fā)生這種情況的原因有很多種,有可能是因為k8s健康檢查的原因,比如使用ps檢查進(jìn)程;或者是程序內(nèi)部死循環(huán),但是不退出;再或者網(wǎng)絡(luò)閃斷,程序無法重連等等。

一個小需求,自動重啟k8s集群中日志不刷新的POD
k8s

需求

日常工作中,所有項目都不是完美的,筆者就經(jīng)常遇到這種情況,pod狀態(tài)是running,但是程序卻沒有響應(yīng)。發(fā)生這種情況的原因有很多種,有可能是因為k8s健康檢查的原因,比如使用ps檢查進(jìn)程;或者是程序內(nèi)部死循環(huán),但是不退出;再或者網(wǎng)絡(luò)閃斷,程序無法重連等等。

無論什么原因,都會有解決辦法,但是優(yōu)化需要時間,在未完全解決之前,問題不能不解決,于是想到了一個臨時方案,因為筆者公司項目日志是直接打印在stdout的,發(fā)生了程序無響應(yīng)的情況,比較簡單的一個辦法是判斷日志輸出的時間?;诖?,可以簡單寫一個小腳本,發(fā)現(xiàn)日志長時間不輸出的時候,重啟pod。

思路

使用kubectl logs命令查看最后一條日志輸出的時間戳,與服務(wù)器時間對比,差值大于閾值,則重啟相應(yīng)POD。當(dāng)然,這只是一個簡單的思路,并不適用于大部分場景,但是適合筆者公司,因為核心項目請求量很大,但凡是超過1分鐘日志不刷新,基本可以斷定100%出現(xiàn)問題了。

此思路其實也是拋磚引玉,希望能給大家一些靈感,如果有什么更好的辦法,也可以與筆者溝通交流。

簡單實現(xiàn)

shell比較簡單,直接與服務(wù)器交互也比較友好,就是用shell來寫吧。

  1. #!/bin/sh 
  2. # 獲取當(dāng)前UTC時間utc_now=`date -u` 
  3. # 將時間轉(zhuǎn)換為timestamptimestamp_now=`date -d "$utc_now" +%s` 
  4. function restart_pod() { 
  5.     for i in `kubectl get pod -n iot|grep PODNAME|awk '{print $1}'`;do 
  6.         for time in `kubectl logs  --tail=1 --timestamps $i -n iot | awk '{print $1}'`;do 
  7.             timestamp_pod=`date -d "$time" +%s` 
  8.             delay=$(($timestamp_now-$timestamp_pod))            echo $i:$delay            if [ "$delay" -ge "30" ];then 
  9.                 echo "Pod $i 30S內(nèi)沒有最新日志產(chǎn)生,重啟pod!" 
  10.                 echo $i                kubectl delete pod $i -n iot --force --grace-period=0 
  11.                 curlwxFunc "Pod $i 30S內(nèi)沒有最新日志產(chǎn)生,重啟pod!(生產(chǎn)環(huán)境)" 
  12.             fi        done    done}function curlwxFunc() { 
  13.     JSON='{ 
  14.             "msgtype""text"
  15.             "text": { 
  16.                 "content""'$1'" 
  17.             } 
  18.         }' 
  19.     curl 'https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxx' \ 
  20.     -H 'Content-Type:application/json' \ 
  21.     -d "${JSON}" 
  22. }restart_pod 

腳本很簡單,先查詢pod,然后看pod最后一條日志時間,與服務(wù)器時間對比,延遲超過30s就重啟pod,并且調(diào)用企業(yè)微信接口發(fā)一條通知。

后記

此方法也是治標(biāo)不治本,治標(biāo)還需要從源頭解決,不過需要時間,再沒有解決之前,先用這個小腳本抗一抗吧。也歡迎大家拍磚。

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2021-04-22 09:46:35

K8SCluster Aut集群

2023-07-04 07:30:03

容器Pod組件

2020-02-29 15:23:15

Kubernetes集群程序

2020-02-29 15:20:18

K8SKubernetes集群

2022-06-01 09:38:36

KubernetesPod容器

2023-09-03 23:58:23

k8s集群容量

2023-03-05 21:50:46

K8s集群容量

2021-11-04 07:49:58

K8SStatefulSetMySQL

2022-11-02 10:21:41

K8s pod運(yùn)維

2024-03-18 15:44:48

K8S故障運(yùn)維

2024-02-01 09:48:17

2023-11-06 01:17:25

主機(jī)容器選項

2020-07-30 09:10:21

DockerK8s容器

2021-06-07 08:32:06

K8S集群Poddebug

2024-10-23 11:34:18

云計算KubernetesAkamai

2023-11-06 07:16:22

WasmK8s模塊

2022-04-22 13:32:01

K8s容器引擎架構(gòu)

2023-09-07 08:58:36

K8s多集群

2021-09-14 13:49:32

開發(fā)技能工具

2021-07-28 10:10:57

K8SMount PVCPod
點贊
收藏

51CTO技術(shù)棧公眾號