偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<ruby id="wjsy5"><progress id="wjsy5"></progress></ruby>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

一致性哈希算法與Java實(shí)現(xiàn)

作者：王森豐 2016-12-19 18:41:09

企業(yè)動(dòng)態(tài) 算法

一致性哈希算法在1997年由麻省理工學(xué)院提出的一種分布式哈希（DHT）實(shí)現(xiàn)算法，設(shè)計(jì)目標(biāo)是為了解決因特網(wǎng)中的熱點(diǎn)(Hot spot)問題，初衷和CARP十分類似。一致性哈希修正了CARP使用的簡(jiǎn) 單哈希算法帶來的問題，使得分布式哈希（DHT）可以在P2P環(huán)境中真正得到應(yīng)用。

一致性哈希算法在1997年由麻省理工學(xué)院提出的一種分布式哈希(DHT)實(shí)現(xiàn)算法，設(shè)計(jì)目標(biāo)是為了解決因特網(wǎng)中的熱點(diǎn)(Hot spot)問題，初衷和CARP十分類似。一致性哈希修正了CARP使用的簡(jiǎn) 單哈希算法帶來的問題，使得分布式哈希(DHT)可以在P2P環(huán)境中真正得到應(yīng)用。

一致性hash算法提出了在動(dòng)態(tài)變化的Cache環(huán)境中，判定哈希算法好壞的四個(gè)定義：

1、平衡性(Balance)：平衡性是指哈希的結(jié)果能夠盡可能分布到所有的緩沖中去，這樣可以使得所有的緩沖空間都得到利用。很多哈希算法都能夠滿足這一條件。

2、單調(diào)性(Monotonicity)：?jiǎn)握{(diào)性是指如果已經(jīng)有一些內(nèi)容通過哈希分派到了相應(yīng)的緩沖中，又有新的緩沖加入到系統(tǒng)中。哈希的結(jié)果應(yīng)能夠保證原有已分配的內(nèi)容可以被映射到原有的或者新的緩沖中去，而不會(huì)被映射到舊的緩沖集合中的其他緩沖區(qū)。

3、分散性(Spread)：在分布式環(huán)境中，終端有可能看不到所有的緩沖，而是只能看到其中的一部分。當(dāng)終端希望通過哈希過程將內(nèi)容映射到緩沖上時(shí)，由于不同終端所見的緩沖范圍有可能不同，從而導(dǎo)致哈希的結(jié)果不一致，最終的結(jié)果是相同的內(nèi)容被不同的終端映射到不同的緩沖區(qū)中。這種情況顯然是應(yīng)該避免的，因?yàn)樗鼘?dǎo)致相同內(nèi)容被存儲(chǔ)到不同緩沖中去，降低了系統(tǒng)存儲(chǔ)的效率。分散性的定義就是上述情況發(fā)生的嚴(yán)重程度。好的哈希算法應(yīng)能夠盡量避免不一致的情況發(fā)生，也就是盡量降低分散性。

4、負(fù)載(Load)：負(fù)載問題實(shí)際上是從另一個(gè)角度看待分散性問題。既然不同的終端可能將相同的內(nèi)容映射到不同的緩沖區(qū)中，那么對(duì)于一個(gè)特定的緩沖區(qū)而言，也可能被不同的用戶映射為不同的內(nèi)容。與分散性一樣，這種情況也是應(yīng)當(dāng)避免的，因此好的哈希算法應(yīng)能夠盡量降低緩沖的負(fù)荷。

在分布式集群中，對(duì)機(jī)器的添加刪除，或者機(jī)器故障后自動(dòng)脫離集群這些操作是分布式集群管理最基本的功能。如果采用常用的hash(object)%N算法，那么在有機(jī)器添加或者刪除后，很多原有的數(shù)據(jù)就無法找到了，這樣嚴(yán)重的違反了單調(diào)性原則。接下來主要講解一下一致性哈希算法是如何設(shè)計(jì)的：

環(huán)形Hash空間

按照常用的hash算法來將對(duì)應(yīng)的key哈希到一個(gè)具有2^32次方個(gè)桶的空間中，即0~(2^32)-1的數(shù)字空間中?，F(xiàn)在我們可以將這些數(shù)字頭尾相連，想象成一個(gè)閉合的環(huán)形。如下圖

把數(shù)據(jù)通過一定的hash算法處理后映射到環(huán)上

現(xiàn)在我們將object1、object2、object3、object4四個(gè)對(duì)象通過特定的Hash函數(shù)計(jì)算出對(duì)應(yīng)的key值，然后散列到Hash環(huán)上。如下圖：

Hash(object1) = key1;

Hash(object2) = key2;

Hash(object3) = key3;

Hash(object4) = key4;

將機(jī)器通過hash算法映射到環(huán)上

在采用一致性哈希算法的分布式集群中將新的機(jī)器加入，其原理是通過使用與對(duì)象存儲(chǔ)一樣的Hash算法將機(jī)器也映射到環(huán)中(一般情況下對(duì)機(jī)器的hash計(jì)算是采用機(jī)器的IP或者機(jī)器唯一的別名作為輸入值)，然后以順時(shí)針的方向計(jì)算，將所有對(duì)象存儲(chǔ)到離自己最近的機(jī)器中。

假設(shè)現(xiàn)在有NODE1，NODE2，NODE3三臺(tái)機(jī)器，通過Hash算法得到對(duì)應(yīng)的KEY值，映射到環(huán)中，其示意圖如下：

Hash(NODE1) = KEY1;

Hash(NODE2) = KEY2;

Hash(NODE3) = KEY3;

通過上圖可以看出對(duì)象與機(jī)器處于同一哈?？臻g中，這樣按順時(shí)針轉(zhuǎn)動(dòng)object1存儲(chǔ)到了NODE1中，object3存儲(chǔ)到了NODE2中，object2、object4存儲(chǔ)到了NODE3中。在這樣的部署環(huán)境中，hash環(huán)是不會(huì)變更的，因此，通過算出對(duì)象的hash值就能快速的定位到對(duì)應(yīng)的機(jī)器中，這樣就能找到對(duì)象真正的存儲(chǔ)位置了。

機(jī)器的刪除與添加

普通hash求余算法最為不妥的地方就是在有機(jī)器的添加或者刪除之后會(huì)照成大量的對(duì)象存儲(chǔ)位置失效，這樣就大大的不滿足單調(diào)性了。下面來分析一下一致性哈希算法是如何處理的。

1. 節(jié)點(diǎn)(機(jī)器)的刪除

以上面的分布為例，如果NODE2出現(xiàn)故障被刪除了，那么按照順時(shí)針遷移的方法，object3將會(huì)被遷移到NODE3中，這樣僅僅是object3的映射位置發(fā)生了變化，其它的對(duì)象沒有任何的改動(dòng)。如下圖：

2. 節(jié)點(diǎn)(機(jī)器)的添加

如果往集群中添加一個(gè)新的節(jié)點(diǎn)NODE4，通過對(duì)應(yīng)的哈希算法得到KEY4，并映射到環(huán)中，如下圖：

通過按順時(shí)針遷移的規(guī)則，那么object2被遷移到了NODE4中，其它對(duì)象還保持這原有的存儲(chǔ)位置。通過對(duì)節(jié)點(diǎn)的添加和刪除的分析，一致性哈希算法在保持了單調(diào)性的同時(shí)，還是數(shù)據(jù)的遷移達(dá)到了最小，這樣的算法對(duì)分布式集群來說是非常合適的，避免了大量數(shù)據(jù)遷移，減小了服務(wù)器的的壓力。

平衡性

根據(jù)上面的圖解分析，一致性哈希算法滿足了單調(diào)性和負(fù)載均衡的特性以及一般hash算法的分散性，但這還并不能當(dāng)做其被廣泛應(yīng)用的原由，因?yàn)檫€缺少了平衡性。下面將分析一致性哈希算法是如何滿足平衡性的。hash算法是不保證平衡的，如上面只部署了NODE1和NODE3的情況(NODE2被刪除的圖)，object1存儲(chǔ)到了NODE1中，而object2、object3、object4都存儲(chǔ)到了NODE3中，這樣就照成了非常不平衡的狀態(tài)。在一致性哈希算法中，為了盡可能的滿足平衡性，其引入了虛擬節(jié)點(diǎn)。

——“虛擬節(jié)點(diǎn)”( virtual node )是實(shí)際節(jié)點(diǎn)(機(jī)器)在 hash 空間的復(fù)制品( replica )，一實(shí)際個(gè)節(jié)點(diǎn)(機(jī)器)對(duì)應(yīng)了若干個(gè)“虛擬節(jié)點(diǎn)”，這個(gè)對(duì)應(yīng)個(gè)數(shù)也成為“復(fù)制個(gè)數(shù)”，“虛擬節(jié)點(diǎn)”在 hash 空間中以hash值排列。

以上面只部署了NODE1和NODE3的情況(NODE2被刪除的圖)為例，之前的對(duì)象在機(jī)器上的分布很不均衡，現(xiàn)在我們以2個(gè)副本(復(fù)制個(gè)數(shù))為例，這樣整個(gè)hash環(huán)中就存在了4個(gè)虛擬節(jié)點(diǎn)，***對(duì)象映射的關(guān)系圖如下：

根據(jù)上圖可知對(duì)象的映射關(guān)系：object1->NODE1-1，object2->NODE1-2，object3->NODE3-2，object4->NODE3-1。通過虛擬節(jié)點(diǎn)的引入，對(duì)象的分布就比較均衡了。那么在實(shí)際操作中，正真的對(duì)象查詢是如何工作的呢?對(duì)象從hash到虛擬節(jié)點(diǎn)到實(shí)際節(jié)點(diǎn)的轉(zhuǎn)換如下圖：

“虛擬節(jié)點(diǎn)”的hash計(jì)算可以采用對(duì)應(yīng)節(jié)點(diǎn)的IP地址加數(shù)字后綴的方式。例如假設(shè)NODE1的IP地址為192.168.1.100。引入“虛擬節(jié)點(diǎn)”前，計(jì)算 cache A 的 hash 值：

Hash(“192.168.1.100”);

引入“虛擬節(jié)點(diǎn)”后，計(jì)算“虛擬節(jié)”點(diǎn)NODE1-1和NODE1-2的hash值：

Hash(“192.168.1.100#1”); // NODE1-1

Hash(“192.168.1.100#2”); // NODE1-2

Java實(shí)現(xiàn)：

public class Shard<S> { // S類封裝了機(jī)器節(jié)點(diǎn)的信息 ，如name、password、ip、port等    
    private TreeMap<Long, S> nodes; // 虛擬節(jié)點(diǎn)    
    private List<S> shards; // 真實(shí)機(jī)器節(jié)點(diǎn)    
    private final int NODE_NUM = 100; // 每個(gè)機(jī)器節(jié)點(diǎn)關(guān)聯(lián)的虛擬節(jié)點(diǎn)個(gè)數(shù)    
    public Shard(List<S> shards) {   
        super();   
        this.shards = shards;   
        init();   
    }   
    private void init() { // 初始化一致性hash環(huán)    
        nodes = new TreeMap<Long, S>();   
        for (int i = 0; i != shards.size(); ++i) { // 每個(gè)真實(shí)機(jī)器節(jié)點(diǎn)都需要關(guān)聯(lián)虛擬節(jié)點(diǎn)    
            final S shardInfo = shards.get(i);   
            for (int n = 0; n < NODE_NUM; n++)   
                // 一個(gè)真實(shí)機(jī)器節(jié)點(diǎn)關(guān)聯(lián)NODE_NUM個(gè)虛擬節(jié)點(diǎn)    
                nodes.put(hash("SHARD-" + i + "-NODE-" + n), shardInfo);   
        }   
    }   
    public S getShardInfo(String key) {   
        SortedMap<Long, S> tail = nodes.tailMap(hash(key)); // 沿環(huán)的順時(shí)針找到一個(gè)虛擬節(jié)點(diǎn)    
        if (tail.size() == 0) {   
            return nodes.get(nodes.firstKey());   
        }   
        return tail.get(tail.firstKey()); // 返回該虛擬節(jié)點(diǎn)對(duì)應(yīng)的真實(shí)機(jī)器節(jié)點(diǎn)的信息    
    }   
    /**  
     *  MurMurHash算法，是非加密HASH算法，性能很高，  
     *  比傳統(tǒng)的CRC32,MD5，SHA-1（這兩個(gè)算法都是加密HASH算法，復(fù)雜度本身就很高，帶來的性能上的損害也不可避免）  
     *  等HASH算法要快很多，而且據(jù)說這個(gè)算法的碰撞率很低.  
     *  http://murmurhash.googlepages.com/  
     */  
    private Long hash(String key) {       
        ByteBuffer buf = ByteBuffer.wrap(key.getBytes());   
        int seed = 0x1234ABCD;   
        ByteOrder byteOrder = buf.order();   
        buf.order(ByteOrder.LITTLE_ENDIAN);   
        long m = 0xc6a4a7935bd1e995L;   
        int r = 47;   
        long h = seed ^ (buf.remaining() * m);   
        long k;   
        while (buf.remaining() >= 8) {   
            k = buf.getLong();   
            k *= m;   
            k ^= k >>> r;   
            k *= m;   
            h ^= k;   
            h *= m;   
        }   
        if (buf.remaining() > 0) {   
            ByteBuffer finish = ByteBuffer.allocate(8).order(   
                    ByteOrder.LITTLE_ENDIAN);   
            // for big-endian version, do this first:    
            // finish.position(8-buf.remaining());    
            finish.put(buf).rewind();   
            h ^= finish.getLong();   
            h *= m;   
        }   
        h ^= h >>> r;   
        h *= m;   
        h ^= h >>> r;   
        buf.order(byteOrder);   
        return h;   
    }   
}

【本文為51CTO專欄作者“王森豐”的原創(chuàng)稿件，轉(zhuǎn)載請(qǐng)注明出處】

責(zé)任編輯：龐桂玉來源：神算子

哈希算法 Java 數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<nobr id="hpko3"></nobr>

<u id="hpko3"><tr id="hpko3"></tr></u>