偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<ruby id="pqgpj"></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

一致性Hash(Consistent Hashing)原理剖析

作者：haozlee 2018-08-08 15:51:44

開發(fā) 開發(fā)工具前端

在業(yè)務(wù)開發(fā)中，我們常把數(shù)據(jù)持久化到數(shù)據(jù)庫中。如果需要讀取這些數(shù)據(jù)，除了直接從數(shù)據(jù)庫中讀取外，為了減輕數(shù)據(jù)庫的訪問壓力以及提高訪問速度，我們更多地引入緩存來對數(shù)據(jù)進(jìn)行存取。

前面一篇文章通過生活化的場景為例，來描述RPC中的一些核心且常用的技術(shù)，(RPC是什么?為什么要學(xué)習(xí)RPC?)在負(fù)載均衡的時候，我們提到一個「一致性Hash」, 這個在RPC之外的許多場景也會使用到。

引入

在業(yè)務(wù)開發(fā)中，我們常把數(shù)據(jù)持久化到數(shù)據(jù)庫中。如果需要讀取這些數(shù)據(jù)，除了直接從數(shù)據(jù)庫中讀取外，為了減輕數(shù)據(jù)庫的訪問壓力以及提高訪問速度，我們更多地引入緩存來對數(shù)據(jù)進(jìn)行存取。讀取數(shù)據(jù)的過程一般為：

圖1：加入緩存的數(shù)據(jù)讀取過程

對于分布式緩存，不同機器上存儲不同對象的數(shù)據(jù)。為了實現(xiàn)這些緩存機器的負(fù)載均衡，可以使用式子1來定位對象緩存的存儲機器：

m = hash(o) mod n ——式子1

其中，o為對象的名稱，n為機器的數(shù)量，m為機器的編號，hash為一hash函數(shù)。圖2中的負(fù)載均衡器(load balancer)正是使用式子1來將客戶端對不同對象的請求分派到不同的機器上執(zhí)行，例如，對于對象o，經(jīng)過式子1的計算，得到m的值為3，那么所有對對象o的讀取和存儲的請求都被發(fā)往機器3執(zhí)行。

圖2：如何利用Hash取模實現(xiàn)負(fù)載均衡

式子1在大部分時候都可以工作得很好，然而，當(dāng)機器需要擴容或者機器出現(xiàn)宕機的情況下，事情就比較棘手了。

當(dāng)機器擴容，需要增加一臺緩存機器時，負(fù)載均衡器使用的式子變成：

m = hash(o) mod (n + 1) ——式子2

當(dāng)機器宕機，機器數(shù)量減少一臺時，負(fù)載均衡器使用的式子變成：

m = hash(o) mod (n - 1) ——式子3

我們以機器擴容的情況為例，說明簡單的取模方法會導(dǎo)致什么問題。假設(shè)機器由3臺變成4臺，對象o1由式子1計算得到的m值為2，由式子2計算得到的m值卻可能為0，1，2，3(一個 3t + 2的整數(shù)對4取模，其值可能為0，1，2，3，讀者可以自行驗證)，大約有75%(3/4)的可能性出現(xiàn)緩存訪問不***的現(xiàn)象。隨著機器集群規(guī)模的擴大，這個比例線性上升。當(dāng)99臺機器再加入1臺機器時，不***的概率是99%(99/100)。這樣的結(jié)果顯然是不能接受的，因為這會導(dǎo)致數(shù)據(jù)庫訪問的壓力陡增，嚴(yán)重情況，還可能導(dǎo)致數(shù)據(jù)庫宕機。

一致性hash算法正是為了解決此類問題的方法，它可以保證當(dāng)機器增加或者減少時，對緩存訪問***的概率影響減至很小。下面我們來詳細(xì)說一下一致性hash算法的具體過程。

一致性Hash環(huán)

一致性hash算法通過一個叫作一致性hash環(huán)的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)。這個環(huán)的起點是0，終點是2^32 - 1，并且起點與終點連接，環(huán)的中間的整數(shù)按逆時針分布，故這個環(huán)的整數(shù)分布范圍是[0, 2^32-1]，如下圖3所示：

圖3：一致性Hash環(huán)

將對象放置到Hash環(huán)

假設(shè)現(xiàn)在我們有4個對象，分別為o1，o2，o3，o4，使用hash函數(shù)計算這4個對象的hash值(范圍為0 ~ 2^32-1):

hash(o1) = m1  
hash(o2) = m2  
hash(o3) = m3  
hash(o4) = m4

把m1，m2，m3，m4這4個值放置到hash環(huán)上，得到如下圖4：

圖4：放置了對象的一致性Hash環(huán)

將機器放置到Hash環(huán)

使用同樣的hash函數(shù)，我們將機器也放置到hash環(huán)上。假設(shè)我們有三臺緩存機器，分別為 c1，c2，c3，使用hash函數(shù)計算這3臺機器的hash值：

hash(c1) = t1  
hash(c2) = t2  
hash(c3) = t3

把t1，t2，t3 這3個值放置到hash環(huán)上，得到如下圖5：

圖5：放置了機器的一致性Hash環(huán)

為對象選擇機器

將對象和機器都放置到同一個hash環(huán)后，在hash環(huán)上順時針查找距離這個對象的hash值最近的機器，即是這個對象所屬的機器。

例如，對于對象o2，順序針找到最近的機器是c1，故機器c1會緩存對象o2。而機器c2則緩存o3，o4，機器c3則緩存對象o1。

圖6：在一致性Hash環(huán)上為對象選擇機器

處理機器增減的情況

對于線上的業(yè)務(wù)，增加或者減少一臺機器的部署是常有的事情。

例如，增加機器c4的部署并將機器c4加入到hash環(huán)的機器c3與c2之間。這時，只有機器c3與c4之間的對象需要重新分配新的機器。對于我們的例子，只有對象o4被重新分配到了c4，其他對象仍在原有機器上。如圖7所示：

圖7：增加機器后的一致性Hash環(huán)的結(jié)構(gòu)

如上文前面所述，使用簡單的求模方法，當(dāng)新添加機器后會導(dǎo)致大部分緩存失效的情況，使用一致性hash算法后這種情況則會得到大大的改善。前面提到3臺機器變成4臺機器后，緩存***率只有25%(不***率75%)。而使用一致性hash算法，理想情況下緩存***率則有75%，而且，隨著機器規(guī)模的增加，***率會進(jìn)一步提高，99臺機器增加一臺后，***率達(dá)到99%，這大大減輕了增加緩存機器帶來的數(shù)據(jù)庫訪問的壓力。

再例如，將機器c1下線(當(dāng)然，也有可能是機器c1宕機)，這時，只有原有被分配到機器c1對象需要被重新分配到新的機器。對于我們的例子，只有對象o2被重新分配到機器c3，其他對象仍在原有機器上。如圖8所示：

圖8：減少機器后的一致性Hash環(huán)的結(jié)構(gòu)

虛擬節(jié)點

上面提到的過程基本上就是一致性hash的基本原理了，不過還有一個小小的問題。新加入的機器c4只分擔(dān)了機器c2的負(fù)載，機器c1與c3的負(fù)載并沒有因為機器c4的加入而減少負(fù)載壓力。如果4臺機器的性能是一樣的，那么這種結(jié)果并不是我們想要的。

為此，我們引入虛擬節(jié)點來解決負(fù)載不均衡的問題。

將每臺物理機器虛擬為一組虛擬機器，將虛擬機器放置到hash環(huán)上，如果需要確定對象的機器，先確定對象的虛擬機器，再由虛擬機器確定物理機器。

說得有點復(fù)雜，其實過程也很簡單。

還是使用上面的例子，假如開始時存在緩存機器c1，c2，c3，對于每個緩存機器，都有3個虛擬節(jié)點對應(yīng)，其一致性hash環(huán)結(jié)構(gòu)如圖9所示：

圖9：機器c1，c2，c3的一致性Hash環(huán)結(jié)構(gòu)

假設(shè)對于對象o1，其對應(yīng)的虛擬節(jié)點為c11，而虛擬節(jié)點c11對象緩存機器c1，故對象o1被分配到機器c1中。

新加入緩存機器c4，其對應(yīng)的虛擬節(jié)點為c41，c42，c43，將這三個虛擬節(jié)點添加到hash環(huán)中，得到的hash環(huán)結(jié)構(gòu)如圖10所示：

圖10：機器c1，c2，c3，c4的一致性Hash環(huán)結(jié)構(gòu)

新加入的緩存機器c4對應(yīng)一組虛擬節(jié)點c41，c42，c43，加入到hash環(huán)后，影響的虛擬節(jié)點包括c31，c22，c11(順時針查找到***個節(jié)點)，而這3個虛擬節(jié)點分別對應(yīng)機器c3，c2，c1。即新加入的一臺機器，同時影響到原有的3臺機器。理想情況下，新加入的機器平等地分擔(dān)了原有機器的負(fù)載，這正是虛擬節(jié)點帶來的好處。而且新加入機器c4后，只影響25%(1/4)對象分配，也就是說，***率仍然有75%，這跟沒有使用虛擬節(jié)點的一致性hash算法得到的結(jié)果是相同的。

總結(jié)

一致性hash算法解決了分布式環(huán)境下機器增加或者減少時，簡單的取模運算無法獲取較高***率的問題。通過虛擬節(jié)點的使用，一致性hash算法可以均勻分擔(dān)機器的負(fù)載，使得這一算法更具現(xiàn)實的意義。正因如此，一致性hash算法被廣泛應(yīng)用于分布式系統(tǒng)中。

【本文為51CTO專欄作者“侯樹成”的原創(chuàng)稿件，轉(zhuǎn)載請通過作者微信公眾號『Tomcat那些事兒』獲取授權(quán)】

戳這里，看該作者更多好文

責(zé)任編輯：趙寧寧來源： 51CTO專欄

Hash 分布式算法

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營