Kubernetes 調(diào)度器是如何工作的
了解 Kubernetes 調(diào)度器是如何發(fā)現(xiàn)新的吊艙并將其分配到節(jié)點。
Kubernetes 已經(jīng)成為容器和容器化工作負載的標準編排引擎。它提供一個跨公有云和私有云環(huán)境的通用和開源的抽象層。
對于那些已經(jīng)熟悉 Kuberbetes 及其組件的人,他們的討論通常圍繞著如何盡量發(fā)揮 Kuberbetes 的功能。但當你剛剛開始學習 Kubernetes 時,嘗試在生產(chǎn)環(huán)境中使用前,明智的做法是從一些關于 Kubernetes 相關組件(包括 Kubernetes 調(diào)度器) 開始學習,如下抽象視圖中所示:
Kubernetes 也分為控制平面和工作節(jié)點:
- 控制平面: 也稱為主控,負責對集群做出全局決策,以及檢測和響應集群事件??刂破矫娼M件包括:
- etcd
- kube-apiserver
- kube-controller-manager
- 調(diào)度器
- 工作節(jié)點: 也稱節(jié)點,這些節(jié)點是工作負載所在的位置。它始終和主控聯(lián)系,以獲取工作負載運行所需的信息,并與集群外部進行通訊和連接。工作節(jié)點組件包括:
- kubelet
- kube-proxy
- CRI
我希望這個背景信息可以幫助你理解 Kubernetes 組件是如何關聯(lián)在一起的。
Kubernetes 調(diào)度器是如何工作的
Kubernetes 吊艙 由一個或多個容器組成組成,共享存儲和網(wǎng)絡資源。Kubernetes 調(diào)度器的任務是確保每個吊艙分配到一個節(jié)點上運行。
(LCTT 譯注:容器技術領域大量使用了航海比喻,pod 一詞,意為“豆莢”,在航海領域指“吊艙” —— 均指盛裝多個物品的容器。常不翻譯,考慮前后文,可譯做“吊艙”。)
在更高層面下,Kubernetes 調(diào)度器的工作方式是這樣的:
- 每個需要被調(diào)度的吊艙都需要加入到隊列
- 新的吊艙被創(chuàng)建后,它們也會加入到隊列
- 調(diào)度器持續(xù)地從隊列中取出吊艙并對其進行調(diào)度
調(diào)度器源碼(scheduler.go)很大,約 9000 行,且相當復雜,但解決了重要問題:
等待/監(jiān)視吊艙創(chuàng)建的代碼
監(jiān)視吊艙創(chuàng)建的代碼始于 scheduler.go 的 8970 行,它持續(xù)等待新的吊艙:
// Run begins watching and scheduling. It waits for cache to be synced, then starts a goroutine and returns immediately.func (sched *Scheduler) Run() {if !sched.config.WaitForCacheSync() {return}go wait.Until(sched.scheduleOne, 0, sched.config.StopEverything)
負責對吊艙進行排隊的代碼
負責對吊艙進行排隊的功能是:
// queue for pods that need schedulingpodQueue *cache.FIFO
負責對吊艙進行排隊的代碼始于 scheduler.go 的 7360 行。當事件處理程序觸發(fā),表明新的吊艙顯示可用時,這段代碼將新的吊艙加入隊列中:
func (f *ConfigFactory) getNextPod() *v1.Pod {for {pod := cache.Pop(f.podQueue).(*v1.Pod)if f.ResponsibleForPod(pod) {glog.V(4).Infof("About to try and schedule pod %v", pod.Name)return pod}}}
處理錯誤代碼
在吊艙調(diào)度中不可避免會遇到調(diào)度錯誤。以下代碼是處理調(diào)度程序錯誤的方法。它監(jiān)聽 podInformer 然后拋出一個錯誤,提示此吊艙尚未調(diào)度并被終止:
// scheduled pod cachepodInformer.Informer().AddEventHandler(cache.FilteringResourceEventHandler{FilterFunc: func(obj interface{}) bool {switch t := obj.(type) {case *v1.Pod:return assignedNonTerminatedPod(t)default:runtime.HandleError(fmt.Errorf("unable to handle object in %T: %T", c, obj))return false}},
換句話說,Kubernetes 調(diào)度器負責如下:
- 將新創(chuàng)建的吊艙調(diào)度至具有足夠空間的節(jié)點上,以滿足吊艙的資源需求。
- 監(jiān)聽 kube-apiserver 和控制器是否創(chuàng)建新的吊艙,然后調(diào)度它至集群內(nèi)一個可用的節(jié)點。
- 監(jiān)聽未調(diào)度的吊艙,并使用
/binding子資源 API 將吊艙綁定至節(jié)點。
例如,假設正在部署一個需要 1 GB 內(nèi)存和雙核 CPU 的應用。因此創(chuàng)建應用吊艙的節(jié)點上需有足夠資源可用,然后調(diào)度器會持續(xù)運行監(jiān)聽是否有吊艙需要調(diào)度。
了解更多
要使 Kubernetes 集群工作,你需要使以上所有組件一起同步運行。調(diào)度器有一段復雜的的代碼,但 Kubernetes 是一個很棒的軟件,目前它仍是我們在討論或采用云原生應用程序時的首選。
學習 Kubernetes 需要精力和時間,但是將其作為你的專業(yè)技能之一能為你的職業(yè)生涯帶來優(yōu)勢和回報。有很多很好的學習資源可供使用,而且 官方文檔 也很棒。如果你有興趣了解更多,建議從以下內(nèi)容開始:
































