Redis緩存總結(jié):淘汰機(jī)制、緩存雪崩、數(shù)據(jù)不一致....
https://github.com/Ccww-lx/JavaCommunity
在實(shí)際的工作項(xiàng)目中, 緩存成為高并發(fā)、高性能架構(gòu)的關(guān)鍵組件 ,那么Redis為什么可以作為緩存使用呢?首先可以作為緩存的兩個(gè)主要特征:
- 
    
在分層系統(tǒng)中處于內(nèi)存/CPU具有訪問性能良好,
 - 
    
緩存數(shù)據(jù)飽和,有良好的數(shù)據(jù)淘汰機(jī)制
 
由于Redis 天然就具有這兩個(gè)特征,Redis基于內(nèi)存操作的,且其具有完善的數(shù)據(jù)淘汰機(jī)制,十分適合作為緩存組件。
其中,基于內(nèi)存操作,容量可以為32-96GB,且操作時(shí)間平均為100ns,操作效率高。而且數(shù)據(jù)淘汰機(jī)制眾多,在Redis 4.0 后就有8種了促使Redis作為緩存可以適用很多場(chǎng)景。
那Redis緩存為什么需要數(shù)據(jù)淘汰機(jī)制呢?有哪8種數(shù)據(jù)淘汰機(jī)制呢?
數(shù)據(jù)淘汰機(jī)制
Redis緩存基于內(nèi)存實(shí)現(xiàn)的,則其緩存其容量是有限的,當(dāng)出現(xiàn)緩存被寫滿的情況,那么這時(shí)Redis該如何處理呢?
Redis對(duì)于緩存被寫滿的情況,Redis就需要緩存數(shù)據(jù)淘汰機(jī)制,通過一定淘汰規(guī)則將一些數(shù)據(jù)刷選出來刪除,讓緩存服務(wù)可再使用。那么Redis使用哪些淘汰策略進(jìn)行刷選刪除數(shù)據(jù)?
在Redis 4.0 之后,Redis 緩存淘汰策略6+2種,包括分成三大類:
- 
    
不淘汰數(shù)據(jù)
- 
        
noeviction ,不進(jìn)行數(shù)據(jù)淘汰,當(dāng)緩存被寫滿后,Redis不提供服務(wù)直接返回錯(cuò)誤。
 
 - 
        
 - 
    
在設(shè)置過期時(shí)間的鍵值對(duì)中,
- 
        
volatile-random ,在設(shè)置過期時(shí)間的鍵值對(duì)中隨機(jī)刪除
 - 
        
volatile-ttl ,在設(shè)置過期時(shí)間的鍵值對(duì),基于過期時(shí)間的先后進(jìn)行刪除,越早過期的越先被刪除。
 - 
        
volatile-lru , 基于LRU(Least Recently Used) 算法篩選設(shè)置了過期時(shí)間的鍵值對(duì), 最近最少使用的原則來篩選數(shù)據(jù)
 - 
        
volatile-lfu ,使用 LFU( Least Frequently Used ) 算法選擇設(shè)置了過期時(shí)間的鍵值對(duì), 使用頻率最少的鍵值對(duì),來篩選數(shù)據(jù)。
 
 - 
        
 - 
    
在所有的鍵值對(duì)中,
- 
        
allkeys-random, 從所有鍵值對(duì)中隨機(jī)選擇并刪除數(shù)據(jù)
 - 
        
allkeys-lru, 使用 LRU 算法在所有數(shù)據(jù)中進(jìn)行篩選
 - 
        
allkeys-lfu, 使用 LFU 算法在所有數(shù)據(jù)中進(jìn)行篩選
 
 - 
        
 
Note: LRU( 最近最少使用,Least Recently Used)算法, LRU維護(hù)一個(gè)雙向鏈表 ,鏈表的頭和尾分別表示 MRU 端和 LRU 端,分別代表最近最常使用的數(shù)據(jù)和最近最不常用的數(shù)據(jù)。
LRU 算法在實(shí)際實(shí)現(xiàn)時(shí),需要用鏈表管理所有的緩存數(shù)據(jù),這會(huì)帶來額外的空間開銷。而且,當(dāng)有數(shù)據(jù)被訪問時(shí),需要在鏈表上把該數(shù)據(jù)移動(dòng)到 MRU 端,如果有大量數(shù)據(jù)被訪問,就會(huì)帶來很多鏈表移動(dòng)操作,會(huì)很耗時(shí),進(jìn)而會(huì)降低 Redis 緩存性能。
其中,LRU和LFU 基于Redis的對(duì)象結(jié)構(gòu) redisObject 的 lru 和 refcount 屬性實(shí)現(xiàn)的:
- typedef struct redisObject {
 - unsigned type:4;
 - unsigned encoding:4;
 - // 對(duì)象最后一次被訪問的時(shí)間
 - unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or
 - * LFU data (least significant 8 bits frequency
 - // 引用計(jì)數(shù) * and most significant 16 bits access time). */
 - int refcount;
 - void *ptr;
 - } robj;
 
Redis 的 LRU 會(huì)使用 redisObject 的 lru 記錄最近一次被訪問的時(shí)間,隨機(jī)選取參數(shù) maxmemory-samples 配置的數(shù)量作為候選集合,在其中選擇 lru 屬性值最小的數(shù)據(jù)淘汰出去。
在實(shí)際項(xiàng)目中,那么該如何選擇數(shù)據(jù)淘汰機(jī)制呢?
- 
    
優(yōu)先選擇
allkeys-lru算法,將最近最常訪問的數(shù)據(jù)留在緩存中,提升應(yīng)用的訪問性能。 - 
    
有頂置數(shù)據(jù)使用
volatile-lru算法 ,頂置數(shù)據(jù)不設(shè)置緩存過期時(shí)間,其他數(shù)據(jù)設(shè)置過期時(shí)間,基于LRU 規(guī)則進(jìn)行篩選 。 
在理解了Redis緩存淘汰機(jī)制后,來看看Redis作為緩存其有多少種模式呢?
Redis緩存模式
Redis緩存模式基于是否接收寫請(qǐng)求,可以分成只讀緩存和讀寫緩存:
只讀緩存:只處理讀操作,所有的更新操作都在數(shù)據(jù)庫(kù)中,這樣數(shù)據(jù)不會(huì)有丟失的風(fēng)險(xiǎn)。
讀寫緩存,讀寫操作都在緩存中執(zhí)行,出現(xiàn)宕機(jī)故障,會(huì)導(dǎo)致數(shù)據(jù)丟失。緩存寫回?cái)?shù)據(jù)到數(shù)據(jù)庫(kù)有分成兩種同步和異步:
- 
    
同步:訪問性能偏低,其更加側(cè)重于保證數(shù)據(jù)可靠性
 - 
    
Read-Throug模式
 - 
    
Write-Through模式
 - 
    
異步:有數(shù)據(jù)丟失風(fēng)險(xiǎn),其側(cè)重于提供低延遲訪問
 
- 
    
Write-Behind模式
 
Cache Aside模式
查詢數(shù)據(jù)先從緩存讀取數(shù)據(jù),如果緩存中不存在,則再到數(shù)據(jù)庫(kù)中讀取數(shù)據(jù),獲取到數(shù)據(jù)之后更新到緩存Cache中, 但更新數(shù)據(jù)操作,會(huì)先去更新數(shù)據(jù)庫(kù)種的數(shù)據(jù),然后將緩存種的數(shù)據(jù)失效。
而且Cache Aside模式會(huì)存在并發(fā)風(fēng)險(xiǎn):執(zhí)行讀操作未命中緩存,然后查詢數(shù)據(jù)庫(kù)中取數(shù)據(jù),數(shù)據(jù)已經(jīng)查詢到還沒放入緩存,同時(shí)一個(gè)更新寫操作讓緩存失效,然后讀操作再把查詢到數(shù)據(jù)加載緩存,導(dǎo)致緩存的臟數(shù)據(jù)。
Read/Write-Throug模式
查詢數(shù)據(jù)和更新數(shù)據(jù)都直接訪問緩存服務(wù), 緩存服務(wù)同步方式地將數(shù)據(jù)更新到數(shù)據(jù)庫(kù) 。出現(xiàn)臟數(shù)據(jù)的概率較低,但是就強(qiáng)依賴緩存,對(duì)緩存服務(wù)的穩(wěn)定性有較大要求,但同步更新會(huì)導(dǎo)致其性能不好。
Write Behind模式
查詢數(shù)據(jù)和更新數(shù)據(jù)都直接訪問緩存服務(wù), 但緩存服務(wù)使用異步方式地將數(shù)據(jù)更新到數(shù)據(jù)庫(kù)(通過異步任務(wù)) 速度快,效率會(huì)非常高,但是數(shù)據(jù)的一致性比較差,還可能會(huì)有數(shù)據(jù)的丟失情況,實(shí)現(xiàn)邏輯也較為復(fù)雜。
在實(shí)際項(xiàng)目開發(fā)中根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景需求來進(jìn)行選擇緩存模式。那了解上述后,我們的應(yīng)用中為什么需要使用到 redis 緩存呢?
在應(yīng)用使用 Redis 緩存可以提高系統(tǒng)性能和并發(fā),主要體現(xiàn)在
- 
    
高性能:基于內(nèi)存查詢,KV結(jié)構(gòu),簡(jiǎn)單邏輯運(yùn)算
 - 
    
高并發(fā):
Mysql每秒只能支持2000左右的請(qǐng)求,Redis輕松每秒1W以上。讓80%以上查詢走緩存,20%以下查詢走數(shù)據(jù)庫(kù),能讓系統(tǒng)吞吐量有很大的提高 
雖然使用Redis緩存可以大大提升系統(tǒng)的性能,但是使用了緩存,會(huì)出現(xiàn)一些問題,比如,緩存與數(shù)據(jù)庫(kù)雙向不一致、緩存雪崩等,對(duì)于出現(xiàn)的這些問題該怎么解決呢?
使用緩存常見的問題
使用了緩存,會(huì)出現(xiàn)一些問題,主要體現(xiàn)在:
- 
    
緩存與數(shù)據(jù)庫(kù)雙寫不一致
 - 
    
緩存雪崩: Redis 緩存無法處理大量的應(yīng)用請(qǐng)求,轉(zhuǎn)移到數(shù)據(jù)庫(kù)層導(dǎo)致數(shù)據(jù)庫(kù)層的壓力激增;
 - 
    
緩存穿透:訪問數(shù)據(jù)不存在在Redis緩存中和數(shù)據(jù)庫(kù)中,導(dǎo)致大量訪問穿透緩存直接轉(zhuǎn)移到數(shù)據(jù)庫(kù)導(dǎo)致數(shù)據(jù)庫(kù)層的壓力激增;
 - 
    
緩存擊穿:緩存無法處理高頻熱點(diǎn)數(shù)據(jù),導(dǎo)致直接高頻訪問數(shù)據(jù)庫(kù)導(dǎo)致數(shù)據(jù)庫(kù)層的壓力激增;
 
緩存與數(shù)據(jù)庫(kù)數(shù)據(jù)不一致
只讀緩存( Cache Aside 模式)
對(duì)于 只讀緩存( Cache Aside 模式) ,讀 操作都發(fā)生在緩存中 ,數(shù)據(jù)不一致只會(huì)發(fā)生在 刪改操作 上(新增操作不會(huì),因?yàn)樾略鲋粫?huì)在數(shù)據(jù)庫(kù)處理),當(dāng)發(fā)生刪改操作時(shí),緩存將數(shù)據(jù)中標(biāo)志為無效和更新數(shù)據(jù)庫(kù)。因此在更新數(shù)據(jù)庫(kù)和刪除緩存值的過程中,無論這兩個(gè)操作的執(zhí)行順序誰先誰后,只要有一個(gè)操作失敗了就會(huì)出現(xiàn)數(shù)據(jù)不一致的情況。
總結(jié)出, 當(dāng)不存在并發(fā)的情況使用重試機(jī)制(消息隊(duì)列使用),當(dāng)存在高并發(fā)的情況,使用延遲雙刪除(在第一次刪除后,睡眠一定時(shí)間后,再進(jìn)行刪除) ,具體如下:
    
        
             
    
    
        操作順序 
            是否高并發(fā) 
            潛在問題 
            現(xiàn)象 
            應(yīng)對(duì)方案 
        
             
        先刪除緩存,再更新數(shù)據(jù)庫(kù) 
            否 
            緩存刪除成功,數(shù)據(jù)庫(kù)更新失敗 
            讀到數(shù)據(jù)庫(kù)的舊值 
            重試機(jī)制(數(shù)據(jù)庫(kù)更新) 
        
             
        先更新數(shù)據(jù)庫(kù),再刪除緩存 
            否 
            數(shù)據(jù)庫(kù)更新成功,緩存刪除失敗 
            讀到緩存的舊值 
            重試機(jī)制(緩存刪除) 
        
             
        先刪除緩存,再更新數(shù)據(jù)庫(kù) 
            是 
            緩存刪除后,尚未更新數(shù)據(jù)庫(kù),有并發(fā)讀請(qǐng)求 
            并發(fā)讀請(qǐng)求讀到數(shù)據(jù)庫(kù)舊值,并更新到緩存,導(dǎo)致之后的讀請(qǐng)求讀到舊值 
            延遲雙刪() 
        
             
    
先更新數(shù)據(jù)庫(kù),再刪除緩存 
            是 
            數(shù)據(jù)庫(kù)更新成功,尚未刪除緩存 
            讀到緩存的舊值 
            不一致的情況短暫存在,對(duì)業(yè)務(wù)影響較小 
        
NOTE:
延遲雙刪除偽代碼:
- redis.delKey(X)
 - db.update(X)
 - Thread.sleep(N)
 - redis.delKey(X)
 
讀寫緩存(Read/Write-Throug、Write Behind模式 )
對(duì)于讀寫緩存,寫操作都發(fā)生在緩存中,后再更新數(shù)據(jù)庫(kù),只要有一個(gè)操作失敗了就會(huì)出現(xiàn)數(shù)據(jù)不一致的情況。
總結(jié)出,當(dāng)不存在并發(fā)的情況使用重試機(jī)制(消息隊(duì)列使用),當(dāng)存在高并發(fā)的情況,使用分布鎖。具體如下:
    
        
             
    
    
        操作順序 
            是否高    并發(fā) 
            潛在問題 
            現(xiàn)象 
            應(yīng)對(duì)方案 
        
             
        先更新緩存,再更新數(shù)據(jù)庫(kù) 
            否 
            緩存更新成功,數(shù)據(jù)庫(kù)更新失敗 
            會(huì)從緩存中讀到最新值,短期影響不大 
            重試機(jī)制(數(shù)據(jù)庫(kù)更新) 
        
             
        先更新數(shù)據(jù)庫(kù),再更新緩存 
            否 
            數(shù)據(jù)庫(kù)更新成功,緩存更新失敗 
            會(huì)從緩存讀到舊值 
            重試機(jī)制(緩存刪除) 
        
             
        先更新數(shù)據(jù)庫(kù),再更新緩存 
            寫+讀并發(fā) 
            線程A先更新數(shù)據(jù)庫(kù),之后線程B讀取數(shù)據(jù),之后線程A更新緩存 
            B會(huì)命中緩存,讀取到舊值 
            A更新緩存前,對(duì)業(yè)務(wù)有短暫影響 
        
             
        先更新緩存,再更新數(shù)據(jù)庫(kù) 
            寫+讀并發(fā) 
            線程A先更新緩存成功,之后線程B讀取數(shù)據(jù),此時(shí)線程B命中緩存,讀取到最新值后返回,之后線程A更新數(shù)據(jù)庫(kù)成功 
            B會(huì)命中緩存,讀取到最新值 
            業(yè)務(wù)沒影響 
        
             
        先更新數(shù)據(jù)庫(kù),再更新緩存 
            寫+寫并發(fā) 
            線程A和線程B同時(shí)更新同一條數(shù)據(jù),更新數(shù)據(jù)庫(kù)的順序是先A后B,但更新緩存時(shí)順序是先B后A,這會(huì)導(dǎo)致數(shù)據(jù)庫(kù)和緩存的不一致 
            數(shù)據(jù)庫(kù)和緩存的不一致 
            寫操作加分布式鎖 
        
             
    
先更新緩存,再更新數(shù)據(jù)庫(kù) 
            寫+寫并發(fā) 
            線程A和線程B同時(shí)更新同一條數(shù)據(jù),更新緩存的順序是先A后B,但是更新數(shù)據(jù)庫(kù)的順序是先B后A,這也會(huì)導(dǎo)致數(shù)據(jù)庫(kù)和緩存的不一致 
            數(shù)據(jù)庫(kù)和緩存的不一致 
            寫操作加分布式鎖 
        
緩存雪崩
緩存雪崩,由于緩存中有大量數(shù)據(jù)同時(shí)過期失效或者緩存出現(xiàn)宕機(jī),大量的應(yīng)用請(qǐng)求無法在 Redis 緩存中進(jìn)行處理,進(jìn)而發(fā)送到數(shù)據(jù)庫(kù)層導(dǎo)致數(shù)據(jù)庫(kù)層的壓力激增,嚴(yán)重的會(huì)造成數(shù)據(jù)庫(kù)宕機(jī)。
對(duì)于緩存中有大量數(shù)據(jù)同時(shí)過期,導(dǎo)致大量請(qǐng)求無法得到處理, 解決方式:
- 
    
數(shù)據(jù)預(yù)熱, 將發(fā)生大并發(fā)訪問前手動(dòng)觸發(fā)加載緩存不同的key, 可以避免在用戶請(qǐng)求的時(shí)候,先查詢數(shù)據(jù)庫(kù)
 
- 
    
設(shè)置不同的過期時(shí)間,讓緩存失效的時(shí)間點(diǎn)盡量均勻
 - 
    
雙層緩存策略, 在原始緩存上加上拷貝緩存,原始緩存失效時(shí)可以訪問拷貝緩存,且原始緩存失效時(shí)間設(shè)置為短期,拷貝緩存設(shè)置為長(zhǎng)期
 - 
    
服務(wù)降級(jí) , 發(fā)生緩存雪崩時(shí),針對(duì)不同的數(shù)據(jù)采取不同的降級(jí)方案,比如,非核心數(shù)據(jù)直接返回預(yù)定義信息、空值或是錯(cuò)誤信息
 
對(duì)于緩存出現(xiàn)宕機(jī),解決方式:
- 
    
業(yè)務(wù)系統(tǒng)中實(shí)現(xiàn)服務(wù)熔斷或請(qǐng)求限流機(jī)制,防止大量訪問導(dǎo)致數(shù)據(jù)庫(kù)出現(xiàn)宕機(jī)
 
緩存穿透
緩存穿透,數(shù)據(jù)在數(shù)據(jù)庫(kù)和緩存中都不存在,這樣就導(dǎo)致查詢數(shù)據(jù),在緩存中找不到對(duì)應(yīng) key 的 value ,都要去數(shù)據(jù)庫(kù)再查詢一遍,然后返回空(相當(dāng)于進(jìn)行了兩次無用的查詢)。
當(dāng)有大量訪問請(qǐng)求,且其繞過緩存直接查數(shù)據(jù)庫(kù),導(dǎo)致數(shù)據(jù)庫(kù)層的壓力激增,嚴(yán)重的會(huì)造成數(shù)據(jù)庫(kù)宕機(jī)。
對(duì)于緩存穿透,解決方式:
- 
    
緩存空值或缺省值,當(dāng)一個(gè)查詢返回的數(shù)據(jù)為空時(shí), 空結(jié)果也將進(jìn)行緩存,并將它的過期時(shí)間設(shè)置比較短,下次訪問直接從緩存中取值,避免了把大量請(qǐng)求發(fā)送給數(shù)據(jù)庫(kù)處理,造成數(shù)據(jù)庫(kù)出問題。
 - 
    
布隆過濾器( BloomFilter ),將所有可能查詢數(shù)據(jù)
key哈希到一個(gè)足夠大的bitmap中 , 在查詢的時(shí)候先去BloomFilter去查詢key是否存在,如果不存在就直接返回,存在再去查詢緩存,緩存中沒有再去查詢數(shù)據(jù)庫(kù) ,從而避免了數(shù)據(jù)庫(kù)層的壓力激增出現(xiàn)宕機(jī)。 
緩存擊穿
緩存擊穿,針對(duì)某個(gè)訪問非常頻繁的熱點(diǎn)數(shù)據(jù)過期失效,導(dǎo)致訪問無法在緩存中進(jìn)行處理,進(jìn)而會(huì)有導(dǎo)致大量的直接請(qǐng)求數(shù)據(jù)庫(kù),從而使得數(shù)據(jù)庫(kù)層的壓力激增,嚴(yán)重的會(huì)造成數(shù)據(jù)庫(kù)宕機(jī)。
對(duì)于緩存擊穿,解決方式:
- 
    
不設(shè)置過期時(shí)間,對(duì)于訪問特別頻繁的熱點(diǎn)數(shù)據(jù),不設(shè)置過期時(shí)間。
 
總結(jié)
在大多數(shù)業(yè)務(wù)場(chǎng)景下,Redis緩存作為只讀緩存使用。針對(duì)只讀緩存來說, 優(yōu)先使用先更新數(shù)據(jù)庫(kù)再刪除緩存的方法保證數(shù)據(jù)一致性 。
其中,緩存雪崩,緩存穿透,緩存擊穿三大問題的原因和解決方式
大量數(shù)據(jù)同時(shí)過期失 效緩存出現(xiàn)宕機(jī) 數(shù)據(jù)預(yù)熱 設(shè)置不同的過期時(shí)間 雙層緩存策略 服務(wù)降級(jí) 服務(wù)熔斷 限流機(jī)制 緩存空值或缺省 值布隆過濾器( BloomFilter )
    
        
             
    
    
        問題 
            原因 
            解決方式 
        
             
        緩存雪崩 
            
             
            
             
        
             
        緩存穿透 
            數(shù)據(jù)在數(shù)據(jù)庫(kù)和緩存中都不存在 
            
             
        
             
    
緩存擊穿 
            訪問非常頻繁的熱點(diǎn)數(shù)據(jù)過期失效 
            對(duì)于訪問特別頻繁的熱點(diǎn)數(shù)據(jù),不設(shè)置過期時(shí)間 
        


















 
 
 











 
 
 
 