偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

真厲害！1 秒寫入 10 萬條消息，Kafka 寫得這么快，都是因為這些優(yōu)化！

作者：陳樹義 2022-06-20 08:01:56

開發(fā) 架構(gòu)

Kafka 的寫入流程可以分為將數(shù)據(jù)傳輸?shù)?Kafka 服務(wù)器，之后將數(shù)據(jù)寫入磁盤。在數(shù)據(jù)傳輸階段，Kafka 利用批量加壓縮的方式，極大地提升了每次能發(fā)送的數(shù)據(jù)量，從而提高了寫入速度。

大家好，我是樹義。

Kafka 作為消息隊列中的中堅力量，基本上是每次面試必問的知識點。而說到 Kafka，大家對它的印象就是快！異常地快！

因此，為什么 Kafka 這么快，也是每次面試必問的知識點。對于混跡 Java 技術(shù)圈多年的我來說，Kafka 這么快的特性已經(jīng)了然于胸。今天，就讓我?guī)е蠹冶P一盤！

Kafka 寫入速度非常快，主要得益于其系統(tǒng)架構(gòu)設(shè)計，包括：

PageCache
批量壓縮傳輸
順序、批量寫磁盤
多 partition 分散存儲

PageCache

學(xué)過操作系統(tǒng)的同學(xué)都知道，內(nèi)存是易丟失的存儲介質(zhì)，而磁盤則是不容易丟失的存儲介質(zhì)。但內(nèi)存讀寫速度快，而磁盤讀寫速度慢。操作系統(tǒng)為了能提高寫磁盤的速度，于是在內(nèi)存中開辟了一小塊，用來作為寫入磁盤的緩沖，提高寫磁盤的速度，這小塊內(nèi)存叫 PageCache。

Kafka 之所以這么快，其中一個很重要的點就是用了 PageCache。 Kafka broker 寫入消息的時候，其實并不是直接寫入文件，而是寫入系統(tǒng)的 PageCache 內(nèi)存，后續(xù)才有操作系統(tǒng)刷入文件中。通過這種方式，Kafka broker 就不直接寫文件，而是直接寫內(nèi)存，這樣就非?？焖倭耍?/p>

因為有 PageCache 的存在，也有了所謂的刷盤。簡單來說，就是同步刷盤，還是異步刷盤。同步刷盤，可以理解成寫 PageCache 之后直接寫磁盤。

這樣的好處是消息不會丟失，但是壞處就是速度慢。異步刷盤則相反，寫 PageCache 之后就結(jié)束，等待操作系統(tǒng)異步刷盤。這里說的「盤」指的就是「磁盤」。

Kafka 因此也提供了兩個參數(shù)來控制刷盤方式，分別是：log.flush.interval.messages? 和 log.flush.interval.ms。前者表示數(shù)據(jù)達到多少條就將消息刷到磁盤，如果你希望數(shù)據(jù)不丟失，那么必須設(shè)置為 1。后者表示多久將累積的消息刷到磁盤。這兩個參數(shù)任何一個達到指定值就觸發(fā)寫入。

批量壓縮傳輸

我們都知道 Kafka 消息都是由生產(chǎn)者發(fā)送給 Kafka 服務(wù)器，再由 Kafka 服務(wù)器存儲起來的。在很多情況下，系統(tǒng)的瓶頸不是 CPU 或磁盤，而是網(wǎng)絡(luò)帶寬，對于需要在廣域網(wǎng)上的數(shù)據(jù)中心之間發(fā)送消息的數(shù)據(jù)流水線尤其如此。

Kafka 之所以能這么快，其中有一個很重要的原因是采用了批量壓縮傳輸。在 Kafka 提供的客戶端里，其每次發(fā)送給 Kafka 服務(wù)器的時候，并不是一條消息一條消息發(fā)送，而是一批消息一批消息發(fā)送，并且還會啟用數(shù)據(jù)壓縮算法。通過這種方式，原本可能 1 秒只能發(fā)送 1 條的能力，瞬間提升到了 1 千條，甚至一萬條。

順序、批量寫磁盤

當消息到了 Kafka 服務(wù)器之后，Kafka 寫入內(nèi)存，最終還是需要寫入磁盤。我們知道現(xiàn)在的磁盤大多數(shù)都還是機械結(jié)構(gòu)（SSD 不在討論的范圍內(nèi)）。

如果將消息以隨機寫的方式存入磁盤，就會按柱面、磁頭、扇區(qū)的方式進行（尋址過程），緩慢的機械運動（相對內(nèi)存）會消耗大量時間，導(dǎo)致磁盤的寫入速度只能達到內(nèi)存寫入速度的幾百萬分之一。

為了規(guī)避隨機寫帶來的時間消耗，Kafka 采取順序?qū)懙姆绞酱鎯?shù)據(jù)，這樣就減少了尋址的時間，極大地提高了寫入速度。因此順序?qū)懭氪疟P，是 Kafka 之所以這么快的一個關(guān)鍵原因。其次，Kafka 也采用消息批量寫入磁盤的方式，每次寫入一批數(shù)據(jù)，而不是只寫入一條消息，這樣就極大地提高了效率。

多 partition 分散存儲

我們知道磁盤的寫入是有物理極限的，如果同時有特別多的線程寫入，達到了物理極限，那么其他線程就只能等待了。而 Kafka 存儲的特點是小文件存儲，并且切分成多個 Partition，分散在多個機器。這樣讀取的時候就可以充分利用磁盤的 IO，從而達到高效讀取的目的。

試想，如果文件太大，并且只存在一個磁盤，那么該磁盤的壓力得有多大？

總結(jié)

Kafka 的寫入流程可以分為將數(shù)據(jù)傳輸?shù)?Kafka 服務(wù)器，之后將數(shù)據(jù)寫入磁盤。在數(shù)據(jù)傳輸階段，Kafka 利用批量加壓縮的方式，極大地提升了每次能發(fā)送的數(shù)據(jù)量，從而提高了寫入速度。

而在寫入磁盤環(huán)節(jié)，通過存儲結(jié)構(gòu)的設(shè)計，使得 Kafka 可以批量、順序?qū)懭耄瑥亩鴾p少磁盤尋道的時間。并且通過小文件的存儲方式，提高了整體磁盤的耐受力。

批量寫入、壓縮的傳輸方式，與磁盤順序?qū)懭搿⑿∥募?partition 造就了 Kafka 強悍的寫入速度！

責(zé)任編輯：武曉燕來源：陳樹義

Kafka 服務(wù)器數(shù)據(jù)量

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<em id="tfhsr"></em>