掌握 Kubernetes 集群 Etcd 數(shù)據(jù)備份與快速恢復(fù)方法
在Kubernetes架構(gòu)中,etcd是集群的重要組成部分。所有集群對象及其狀態(tài)都存儲(chǔ)在etcd中。為了更好地理解Kubernetes,有幾點(diǎn)關(guān)于etcd的信息是您需要了解的。
- 它是一個(gè)一致的、分布式的、安全的鍵值存儲(chǔ)。
 - 它使用raft協(xié)議。
 - 支持堆疊etcd的高可用架構(gòu)。
 - 它存儲(chǔ)kubernetes集群配置、所有API對象、對象狀態(tài)和服務(wù)發(fā)現(xiàn)細(xì)節(jié)。
 

Kubernetes etcd 備份使用etcdctl
以下是您應(yīng)該了解的有關(guān) etcd 備份的信息:
- etcd 有一個(gè)內(nèi)置的快照機(jī)制。
 - etcdctl是與 etcd 交互以獲取快照的命令行實(shí)用程序。
 

按照下面給出的步驟備份 etcd 快照:
(1) 登錄到控制平面
(2) 如果群集控制平面中沒有 etcdctl,請使用以下命令進(jìn)行安裝。
sudo apt install etcd-client(3) 我們需要將以下三部分信息傳遞給etcdctl以獲取etcd快照。
- etcd endpoint (–endpoints)
 - ca certificate (–cacert)
 - server certificate (–cert)
 - server key (–key)
 
你可以通過兩種方式獲得上述參數(shù):
- etcd的靜態(tài)pod清單文件位于/etc/kubernetes/manifest/etcd.yaml位置。
 

- 您也可以通過描述在kube-system命名空間中運(yùn)行的etcd pod來獲得上述細(xì)節(jié)。在描述pod時(shí),將etcd-master-node替換為您的etcd pod名稱。
 
kubectl get po -n kube-system
kubectl describe pod etcd-master-node -n kube-system(4) 使用以下命令進(jìn)行etcd快照備份。
ETCDCTL_API=3 etcdctl \
  --endpoints=https://127.0.0.1:2379 \
  --cacert=<ca-file> \
  --cert=<cert-file> \
  --key=<key-file> \
  snapshot save <backup-file-location>添加實(shí)際位置和參數(shù)時(shí),命令如下所示。執(zhí)行該命令進(jìn)行備份。您可以將/opt/backup/etc.db替換為您選擇的位置和名稱。
ETCDCTL_API=3 etcdctl \
  --endpoints=https://127.0.0.1:2379 \
  --cacert=/etc/kubernetes/pki/etcd/ca.crt \
  --cert=/etc/kubernetes/pki/etcd/server.crt \
  --key=/etc/kubernetes/pki/etcd/server.key \
  snapshot save /opt/backup/etcd.db如果執(zhí)行成功,你會(huì)得到一個(gè)“Snapshot saved at /opt/backup/etc.db”的消息,如下所示。

此外,您可以使用以下命令來驗(yàn)證快照。
ETCDCTL_API=3 etcdctl --write-out=table snapshot status /opt/backup/etcd.db下面是一個(gè)示例輸出。
+----------+----------+------------+------------+
|   HASH   | REVISION | TOTAL KEYS | TOTAL SIZE |
+----------+----------+------------+------------+
| b7147656 |    51465 |       1099 |     5.1 MB |
+----------+----------+------------+------------+Kubernetes etcd恢復(fù)使用快照備份
現(xiàn)在我們在/opt/backup/etc.db位置有了備份。我們將使用快照備份來恢復(fù)etcd。
下面是恢復(fù)etcd的命令:
ETCDCTL_API=3 etcdctl snapshot restore <backup-file-location>讓我們執(zhí)行etcd還原命令。/opt/backup/etc.db是備份文件:
ETCDCTL_API=3 etcdctl snapshot restore /opt/backup/etcd.db如果您想使用特定的數(shù)據(jù)目錄進(jìn)行恢復(fù),可以使用--data-dir標(biāo)志添加位置,如下所示:
ETCDCTL_API=3 etcdctl --data-dir /opt/etcd snapshot restore /opt/backup/etcd.db創(chuàng)建定時(shí)任務(wù)備份
通過配置 Kubernetes CronJob,可以指定定期執(zhí)行備份任務(wù)的時(shí)間表,確保etcd數(shù)據(jù)在指定的時(shí)間間隔內(nèi)自動(dòng)備份。這種方式不僅簡化了備份流程,還能確保集群數(shù)據(jù)的安全和持久性,防止數(shù)據(jù)丟失。CronJob的靈活性和自動(dòng)化特性使得管理和維護(hù)etcd備份變得更加高效和可靠。
apiVersion:batch/v1
kind:CronJob
metadata:
  name:etcd-disaster-recovery# 定義 CronJob 的名稱
  namespace:cronjob# 指定 CronJob 所屬的命名空間
spec:
  schedule:"0 2 * * *"# 設(shè)置定時(shí)任務(wù)的調(diào)度時(shí)間表達(dá)式,表示每天凌晨2點(diǎn)執(zhí)行一次
  jobTemplate:
    spec:
      template:
        metadata:
          # labels:
          #   app: etcd-disaster-recovery  # 為 Pod 添加標(biāo)簽,可根據(jù)需要注釋或刪除
        spec:
          affinity:# 定義 Pod 的親和性配置
            nodeAffinity:
              requiredDuringSchedulingIgnoredDuringExecution:
                nodeSelectorTerms:
                -matchExpressions:
                  -key:kubernetes.io/hostname
                    operator:In
                    values:
                    -master01# 選擇特定的節(jié)點(diǎn)(這里是選擇 hostname 為 master01 的節(jié)點(diǎn))
          containers:# 定義 Pod 中的容器
          -name:etcd# 容器名稱
            image:registry.k8s.io/etcd:3.5.10-0# 使用的 etcd 鏡像版本為 3.5.10-0
            imagePullPolicy:"IfNotPresent"# 鏡像拉取策略,如果本地已存在該鏡像,則不重新拉取
            command:# 容器啟動(dòng)命令
            -sh
            --c
            -"export ETCDCTL_API=3; \
               etcdctl --endpoints=$ENDPOINT \
               --cert=/etc/kubernetes/pki/etcd/server.crt \
               --key=/etc/kubernetes/pki/etcd/server.key \
               --cacert=/etc/kubernetes/pki/etcd/ca.crt \
               snapshot save /snapshot/snapshot.db; \
               echo etcd backup success"
            env:# 環(huán)境變量配置,設(shè)置了一個(gè)名為 ENDPOINT 的環(huán)境變量,值為 "https://127.0.0.1:2379"
            -name:ENDPOINT
              value:"https://127.0.0.1:2379"
            volumeMounts:# 掛載配置,指定了容器中需要掛載的卷和掛載路徑
            -mountPath:"/etc/kubernetes/pki/etcd"# 將主機(jī)上的 /etc/kubernetes/pki/etcd 目錄掛載到容器的 /etc/kubernetes/pki/etcd 路徑
              name:etcd-certs
            -mountPath:"/var/lib/etcd"# 將主機(jī)上的 /var/lib/etcd 目錄掛載到容器的 /var/lib/etcd 路徑
              name:etcd-data
            -mountPath:"/snapshot"# 將主機(jī)上的 /root/etcd/snapshot 目錄掛載到容器的 /snapshot 路徑
              name:snapshot
              subPath:data/etcd-snapshot# 在主機(jī)上的 /root/etcd/snapshot 目錄下,將數(shù)據(jù)掛載到容器的 /snapshot/data/etcd-snapshot 路徑下
            -mountPath:/etc/localtime# 將主機(jī)上的 /etc/localtime 文件掛載到容器的 /etc/localtime 路徑
              name:lt-config
            -mountPath:/etc/timezone# 將主機(jī)上的 /etc/timezone 文件掛載到容器的 /etc/timezone 路徑
              name:tz-config
          restartPolicy:OnFailure# 定義容器重啟策略,當(dāng)容器失敗時(shí)才會(huì)重啟
          volumes:# 卷配置,定義了 Pod 中使用的卷
          -name:etcd-certs
            hostPath:
              path:/etc/kubernetes/pki/etcd# 使用主機(jī)上的 /etc/kubernetes/pki/etcd 目錄作為卷
          -name:etcd-data
            hostPath:
              path:/var/lib/etcd# 使用主機(jī)上的 /var/lib/etcd 目錄作為卷
          -name:snapshot
            hostPath:
              path:/root/etcd/snapshot# 使用主機(jī)上的 /root/etcd/snapshot 目錄作為卷
          -name:lt-config
            hostPath:
              path:/etc/localtime# 使用主機(jī)上的 /etc/localtime 文件作為卷
          -name:tz-config
            hostPath:
              path:/etc/timezone# 使用主機(jī)上的 /etc/timezone 文件作為卷
        hostNetwork:true# 使用主機(jī)網(wǎng)絡(luò)模式,Pod 將共享主機(jī)的網(wǎng)絡(luò)命名空間結(jié)論
在這篇博客中,我們學(xué)習(xí)了使用etcdctl命令行實(shí)用工具進(jìn)行Kubernetes etcd備份和恢復(fù)。















 
 
 






 
 
 
 