為什么Redis不直接使用C語(yǔ)言的字符串？

作者：一燈架構(gòu) 2023-03-21 15:27:00

Redis的字符串使用len記錄了字符串的長(zhǎng)度，使用alloc記錄整個(gè)數(shù)組的長(zhǎng)度，(alloc - len)表示未使用的空間長(zhǎng)度。

眾所周知Redis有以下幾種常見(jiàn)的數(shù)據(jù)類(lèi)型 String（字符串）、List（列表）、Set（集合）、Hash（哈希）、Sorted set（有序集合）、Stream（流）、Geo（地理空間索引）、Bitmap（位圖）、HyperLogLog（基數(shù)統(tǒng)計(jì)）等。

我們最常用的就是String（字符串）類(lèi)型，String類(lèi)型既可以存儲(chǔ)字符串，也可以存儲(chǔ)數(shù)字，甚至可以直接進(jìn)行數(shù)值運(yùn)算。

redis> set key1 value1
OK

redis> get key1
"value1"

redis> set key 1
Ok 

redis> INCR key
(integer) 2

Redis是使用標(biāo)準(zhǔn)C語(yǔ)言編寫(xiě)的，而Redis String類(lèi)型底層使用SDS（Simple Dynamic String 簡(jiǎn)單動(dòng)態(tài)字符串），但是卻沒(méi)有使用C語(yǔ)言字符串使用，這到底是為什么呢？

Redis的優(yōu)點(diǎn)是快、安全、節(jié)省內(nèi)存，在設(shè)計(jì)Redis String實(shí)現(xiàn)的時(shí)候，也深刻的體現(xiàn)了Redis的這三個(gè)優(yōu)點(diǎn)。

提到Redis字符串的優(yōu)點(diǎn)，需要先看一下C語(yǔ)言字符串的缺點(diǎn)，畢竟沒(méi)有對(duì)比就沒(méi)有傷害。

1. C語(yǔ)言字符串實(shí)現(xiàn)原理

C語(yǔ)言字符串是使用char數(shù)組存儲(chǔ)，以'\0'作為字符串結(jié)束，比如字符串”Redis“在C語(yǔ)言中存儲(chǔ)結(jié)構(gòu)就是下面這樣：

那么這種存儲(chǔ)方式有什么缺點(diǎn)呢？

1.1 不安全

C語(yǔ)言字符串這種特殊規(guī)定，就導(dǎo)致無(wú)法存儲(chǔ)特殊字符。如果某個(gè)字符串中間包含'\0'字符，讀取字符串的時(shí)候就無(wú)法讀取到完整字符，遇到'\0'就結(jié)束了，像下面這樣，只能讀取到前半部分“Red”。

如果存儲(chǔ)到C語(yǔ)言的字符串，無(wú)法完整讀取，肯定是不安全的，所以C語(yǔ)言無(wú)法存儲(chǔ)包含特殊字符的字符串（例如二進(jìn)制數(shù)據(jù)）。

1.2 查詢(xún)性能較低

如果想要獲取字符串的長(zhǎng)度，需要遍歷整個(gè)字符串，時(shí)間復(fù)雜度是O(n)，查詢(xún)效率較低。

1.3 存在緩存區(qū)溢出風(fēng)險(xiǎn)

開(kāi)發(fā)中最常用的功能是拼接字符串，每次拼接字符串的時(shí)候，都要提前進(jìn)行擴(kuò)容。如果忘記擴(kuò)容了，就會(huì)出現(xiàn)緩存區(qū)溢出。

1.4 擴(kuò)容性能較差

擴(kuò)容過(guò)程是非常耗時(shí)的，而且每次拼接字符串的時(shí)候都需要提交擴(kuò)容。想象一下，如果使用HashMap的時(shí)候，每次put操作都需要進(jìn)行擴(kuò)容，性能將會(huì)差到什么程度。

由于C語(yǔ)言字符串有這么多缺點(diǎn)，而Redis又追求極致性能，所以只能自己實(shí)現(xiàn)一套，看一下Redis字符串底層是怎么實(shí)現(xiàn)的？

2. SDS底層實(shí)現(xiàn)原理

Redis3.0版本之前的底層結(jié)構(gòu)是這樣的：

struct sdshdr {
    // 記錄buf數(shù)組中已使用字節(jié)的數(shù)量
    // 等于SDS所保存字符串的長(zhǎng)度
    int len;

    // 記錄buf數(shù)組中未使用字節(jié)的數(shù)量
    int free;

    // 字節(jié)數(shù)組，用于保存字符串
    char buf[];
};

而最新Redis7.0版本，sds底層結(jié)構(gòu)是這樣的，分成5個(gè)實(shí)現(xiàn)：

為什么會(huì)有5種實(shí)現(xiàn)呢？

看一下每種實(shí)現(xiàn)的len和alloc的類(lèi)型就明白了，sdshdr8里面的類(lèi)型是uint8_t，sdshdr16里面的類(lèi)型是uint16_t，sdshdr32里面的類(lèi)型是uint32_t，sdshdr64里面的類(lèi)型是uint64_t，用來(lái)存儲(chǔ)不同長(zhǎng)度的字符串。使用合適的類(lèi)型，可以節(jié)約大量?jī)?nèi)存。

Redis自己實(shí)現(xiàn)的字符串解決了C語(yǔ)言字符串遇到的問(wèn)題，并且有以下幾個(gè)優(yōu)點(diǎn)：

2.1 存儲(chǔ)安全

sds簡(jiǎn)化版的存儲(chǔ)結(jié)構(gòu)是這樣的：

struct sdshdr {
    // 已經(jīng)使用的字節(jié)數(shù)量
    int len;
    
    // char數(shù)組總字節(jié)數(shù)量
    int alloc;
  
    // 字節(jié)數(shù)組，用于保存字符串
    char buf[];
};

可以看出，Redis的字符串并不是用'\0'表示結(jié)尾，而是使用len記錄了字符串的長(zhǎng)度。想要取出完整的字符串，只需要遍歷len長(zhǎng)度即可。

2.2 查詢(xún)性能較高

Redis的字符串使用len記錄了字符串的長(zhǎng)度，想要獲取整個(gè)字符串的長(zhǎng)度，無(wú)需遍歷字符串，只需要查詢(xún)len值即可，時(shí)間復(fù)雜度是O(1)。

Redis采用空間換時(shí)間的做法，增加了存儲(chǔ)空間，加快了查詢(xún)性能。

2.3 避免緩存區(qū)溢出

Redis的字符串使用len記錄了字符串的長(zhǎng)度，使用alloc記錄整個(gè)數(shù)組的長(zhǎng)度，(alloc - len)表示未使用的空間長(zhǎng)度。

如果新增的拼接字符串長(zhǎng)度小于未使用空間，就不用擴(kuò)容了。

2.4 擴(kuò)容性能較好

Redis字符串還實(shí)現(xiàn)空間預(yù)分配和惰性空間釋放的優(yōu)化策略，減少擴(kuò)容次數(shù)。

簡(jiǎn)單理解就是拼接字符串導(dǎo)致擴(kuò)容的時(shí)候會(huì)多增加一些空閑空間，縮短字符串的時(shí)候并不立即釋放這些空閑空間。

責(zé)任編輯：武曉燕來(lái)源：一燈架構(gòu)

Redis C語(yǔ)言字符串

偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

為什么Redis不直接使用C語(yǔ)言的字符串？