Kafka 如何保證消息消費的全局順序性
哈嘍大家好,我是咸魚
今天我們繼續(xù)來講一講 Kafka
當消息被生產出來的時候,如果沒有指定分區(qū)或者指定 key ,那么消費會按照【輪詢】的方式均勻地分配到所有可用分區(qū)中,但不一定按照分區(qū)順序來分配
圖片
我們知道,在 Kafka 中消費者可以訂閱一個或多個主題,并被分配一個或多個分區(qū)
圖片
如果一個消費者消費了多個分區(qū),某些場景下消費者需要順序地消費消息,但消息并不是按照順序分配給分區(qū)的,所以就不一定能夠保證消息消費的全局順序性
比如下圖中 Msg0002 消息并不是在 Msg0001 消息之后的,就有可能導致消費者先把 Msg0002 消息給消費, Msg0001 消息才被消費
那么這種情況該怎么解決?如何盡可能地保證消息消費的全局順序性?要想消費消息 B 必須先消費消息 A
要注意的是,Kafka 的設計目標是提供高吞吐量和低延遲,而不是強制保證全局有序性
所以這篇文章探討的是需要強調全局順序性場景下的 Kafka 應用
單分區(qū)
最簡單粗暴的方法,雖然 Kafka 不能保證全局消費順序性,但是能夠保證分區(qū)內的消息順序性
圖片
所以我們可以只創(chuàng)建一個分區(qū),并讓消費者消費這個分區(qū),這樣就能夠保證消費的消息是有序的
但是這樣做大大降低了吞吐量和處理效率,容易使得性能出現(xiàn)瓶頸
基于 key 的消息分配策略
在 Kafka 中,基于 key 的消息分配策略是通過消息中的鍵(key)來確定消息發(fā)送到哪個分區(qū)
當生產者發(fā)送消息時,可以指定一個鍵(key),Kafka 使用這個鍵通過哈希算法來確定消息被發(fā)送到哪個分區(qū)
圖片
由于相同的 key 就發(fā)送到同一分區(qū),這樣就能夠保證了消費的消息是有序的
然而,如果只有一個消費者消費相同 key 的消息,那么與單分區(qū)相比,基于 key 的消息分配策略不會提高吞吐量
因為即使相同 key 的消息在多個分區(qū)中,但同一消費者依然只能從一個分區(qū)中消費,這并不會增加整體的處理能力。
但如果有多個消費者消費相同 key 的消息,基于 key 的分區(qū)策略可以提高消費者并行消費的能力
圖片
因為這些消費者可以同時從不同分區(qū)中讀取消息,從而增加整體的處理速度。這種情況下,基于 key 的消息分配可以提高整體吞吐量
最后總結一下:
- Kafka 的設計目標是提供高吞吐量和低延遲,而不是強制保證全局有序性,所以Kafka使用多分區(qū)的概念,并且只保證單分區(qū)有序
- 如果想要實現(xiàn)消息的全局有序
單分區(qū)策略:一個主題下只創(chuàng)建一個分區(qū),一個消費者只消費一個分區(qū),但這樣做毫無并發(fā)性可言,極大降低系統(tǒng)性能
基于 key 的消息分配策略:由于相同的 key 就發(fā)送到同一分區(qū),這樣就能夠保證了消費的消息是有序的。然而,如果只有一個消費者消費相同 key 的消息,與前面單分區(qū)相比沒有什么區(qū)別