還不懂分布系統(tǒng),速看Kafka Controller選舉過程
上篇文章講了Kafka架構,詳細介紹了Kafka中不同組件之間是怎樣協(xié)調工作的。了解到Kafka集群包含多個Broker節(jié)點,但是這些Broker節(jié)點的具體作用是什么?是怎么進行通信的?某個Broker節(jié)點掛了之后,Kafka集群是怎么進行故障轉移,保持高可用的?今天一塊帶大家一塊學習一下。
1. Kafka Broker的作用
Apache Kafka的Broker節(jié)點是Kafka系統(tǒng)的基本組成部分,它們主要負責數(shù)據(jù)的存儲和傳輸。Kafka的所有數(shù)據(jù)都存儲在Broker節(jié)點中,同時它們還負責處理客戶端的讀寫請求,以及在Broker節(jié)點之間復制數(shù)據(jù)以確保數(shù)據(jù)的可靠性和高可用性。

一個Broker節(jié)點相當于一臺機器,多個Broker節(jié)點組成一個Kafka集群。但是只有Broker節(jié)點可以充當Controller(控制器)節(jié)點,Controller節(jié)點直接與zookeeper進行通信,并負責管理整個集群的狀態(tài)和元數(shù)據(jù)信息。
以下是Controller節(jié)點的主要職能:
- Broker狀態(tài)管理:Controller會跟蹤集群中所有Broker的在線狀態(tài),并在Broker宕機或者恢復時更新集群的狀態(tài)。
 - 分區(qū)狀態(tài)管理:當新的Topic被創(chuàng)建,或者已有的Topic被刪除時,Controller會負責管理這些變化,并更新集群的狀態(tài)。
 - 分區(qū)領導者選舉:當一臺Broker節(jié)點宕機時,并且宕機的機器上包含分區(qū)領導者副本時,Controller會負責對其上的所有Partition進行新的領導者選舉。
 - 副本狀態(tài)管理:Controller負責管理Partition的ISR列表,當Follower副本無法及時跟隨Leader副本時,Controller會將其從ISR列表中移除。
 - 分區(qū)重平衡:當添加或刪除Broker節(jié)點時,Controller會負責對Partition的分布進行重平衡,以確保數(shù)據(jù)的均勻分布。
 - 存儲集群元數(shù)據(jù):Controller保存了集群中最全的元數(shù)據(jù)信息,并通過發(fā)送請求同步到其他Broker上面。
 

而非Controller節(jié)點的主要作用如下:
- 數(shù)據(jù)存儲:每個非Controller節(jié)點都存儲一部分數(shù)據(jù),這部分數(shù)據(jù)是由Topic的Partition組成的。這意味著,每個Broker都保存了特定Partition的所有數(shù)據(jù),不論這個Partition是Leader還是Follower。
 - 數(shù)據(jù)復制:為了保證數(shù)據(jù)的可靠性,Kafka系統(tǒng)通過數(shù)據(jù)復制機制在多個Broker之間備份數(shù)據(jù)。每個Topic的Partition都有一個Leader和多個Follower。Leader負責處理所有的客戶端讀寫請求,而Follower負責從Leader復制數(shù)據(jù)。在這個過程中,非Controller節(jié)點既可以是Leader也可以是Follower。
 - 處理客戶端請求:非Controller節(jié)點負責處理來自Producer和Consumer的請求。對于Producer的寫請求,Broker會將數(shù)據(jù)寫入對應的Partition。對于Consumer的讀請求,Broker會從對應的Partition讀取數(shù)據(jù)。
 - 參與Leader選舉:當Partition的Leader節(jié)點出現(xiàn)故障時,非Controller節(jié)點可能被選舉為新的Leader節(jié)點。雖然Leader選舉過程由Controller節(jié)點協(xié)調,但所有的非Controller節(jié)點都需要參與這個過程。
 - 故障恢復:當某個Broker宕機時,Kafka會自動重新分配其上的Partition的Leader角色給其他的Broker,這也是非Controller節(jié)點的重要職責之一。
 
2. Controller節(jié)點初始化
Kafka Controller節(jié)點的初始化依賴Zookeeper實現(xiàn),具體流程如下:
- 注冊 Controller 節(jié)點當 Kafka 集群啟動時,每個 Broker 都會嘗試在 Zookeeper 中的 /controller 路徑下創(chuàng)建一個臨時節(jié)點。因為同一時刻只能存在一個 /controller 節(jié)點,所以只有一個 Broker 成功創(chuàng)建節(jié)點并成為Controller。其他 Broker 會收到節(jié)點創(chuàng)建失敗的通知,然后轉為觀察者(Observer)狀態(tài),監(jiān)視Controller節(jié)點路徑的變化。
 - 監(jiān)聽 Controller 節(jié)點所有非Controller的 Broker 都會在 Zookeeper 中對 /controller 路徑設置一個 Watcher 事件。這樣當Controller節(jié)點發(fā)生變化時(例如,Controller失效),所有非Controller就會收到一個 Watcher 事件。
 - 選舉新的Controller當某個 Broker 接收到Controller節(jié)點變化的通知后,它會再次嘗試在 Zookeeper 中的 /controller 路徑下創(chuàng)建一個臨時節(jié)點。與啟動時的過程類似,只有一個 Broker 能夠成功創(chuàng)建節(jié)點并成為新的Controller。新Controller會在選舉成功后接管集群元數(shù)據(jù)的管理工作。
 - 更新集群元數(shù)據(jù)新Controller在選舉成功后需要更新集群元數(shù)據(jù),包括分區(qū)狀態(tài)、副本狀態(tài)等。同時,新控制器會通知所有相關的 Broker 更新它們的元數(shù)據(jù)信息。這樣,集群中的所有 Broker 都能夠知道新Controller的身份,并進行協(xié)同工作。
 
注意:臨時節(jié)點的特點是在創(chuàng)建它的客戶端(即 Broker節(jié)點)斷開連接時,它會自動被 Zookeeper 刪除。這種機制保證了只有一個Broker節(jié)點能夠成為控制器,以避免多個控制器同時對集群元數(shù)據(jù)進行操作引發(fā)的問題。

3. Kafka腦裂問題
腦裂問題是分布式系統(tǒng)中經常出現(xiàn)的現(xiàn)象,Kafka腦列問題是由于網絡或其他原因導致多個Broker認為自己是Controller,從而導致元數(shù)據(jù)不一致和分區(qū)狀態(tài)混亂的問題。
Kafka是通過epoch number(紀元編號)來解決腦裂問題,epoch number是一個單調遞增的版本號。
腦裂問題產生和處理過程如下:
- 假設有三個Broker,分別是Broker 0,Broker 1和Broker 2。Broker 0是Controller,它在ZooKeeper中創(chuàng)建了/controller節(jié)點,并設置epoch number值為1。Broker 1和Broker 2在/controller節(jié)點設置了Watcher。
 - 由于某種原因,Broker 0出現(xiàn)了Full GC,導致它與ZooKeeper的會話超時。ZooKeeper刪除了/controller節(jié)點,并通知Broker 1和Broker 2進行新的Controller選舉。
 - Broker 1和Broker 2同時嘗試在ZooKeeper中創(chuàng)建/controller節(jié)點,假設Broker 1成功了,那么它就成為了新的Controller,設置epoch number值為2,并向Broker 2同步數(shù)據(jù)。
 - Broker 0的Full GC結束后,繼續(xù)向Broker 1和Broker 2同步數(shù)據(jù),Broker 1和Broker 2接收到數(shù)據(jù)后,發(fā)現(xiàn)epoch number小于當前值,就會拒絕這些消息。并通知Broker 0最新的epoch number,然后Broker 0發(fā)現(xiàn)自己已經不是Controller了,最后與新的Controller建立連接。
 

4. 總結
本文詳細介紹了Kafka Controller的作用和故障轉移過程,以及Kafka是怎么解決腦裂問題的。















 
 
 








 
 
 
 