分布式系統(tǒng)中的CAP理論,面試必問(wèn),你理解了嘛?
對(duì)于剛剛接觸分布式系統(tǒng)的小伙伴們來(lái)說(shuō),一提起分布式系統(tǒng),就感覺(jué)高大上,深不可測(cè)。而且看了很多書(shū)和視頻還是一臉懵逼。這篇文章主要使用大白話的方式,帶你理解一下分布式系統(tǒng)中的CAP理論。保證你能聽(tīng)懂。
1998年,加州大學(xué)的計(jì)算機(jī)科學(xué)家 Eric Brewer 提出,分布式系統(tǒng)有三個(gè)指標(biāo)。
- Consistency
 - Availability
 - Partition tolerance
 
它們的第一個(gè)字母分別是 C、A、P。
Eric Brewer 說(shuō),這三個(gè)指標(biāo)不可能同時(shí)做到。這個(gè)結(jié)論就叫做 CAP 定理。
一、Partition tolerance
先看 Partition tolerance,中文叫做"分區(qū)容錯(cuò)"。
大多數(shù)分布式系統(tǒng)都分布在多個(gè)子網(wǎng)絡(luò)。每個(gè)子網(wǎng)絡(luò)就叫做一個(gè)區(qū)(partition)。分區(qū)容錯(cuò)的意思是,區(qū)間通信可能失敗。比如,一臺(tái)服務(wù)器放在中國(guó),另一臺(tái)服務(wù)器放在美國(guó),這就是兩個(gè)區(qū),它們之間可能無(wú)法通信。
圖片
上圖中,G1 和 G2 是兩臺(tái)跨區(qū)的服務(wù)器。G1 向 G2 發(fā)送一條消息,G2 可能無(wú)法收到。系統(tǒng)設(shè)計(jì)的時(shí)候,必須考慮到這種情況。
一般來(lái)說(shuō),分區(qū)容錯(cuò)無(wú)法避免,因此可以認(rèn)為 CAP 的 P 總是成立。CAP 定理告訴我們,剩下的 C 和 A 無(wú)法同時(shí)做到。
二、Consistency
Consistency 中文叫做"一致性"。意思是,寫(xiě)操作之后的讀操作,必須返回該值。舉例來(lái)說(shuō),某條記錄是 v0,用戶(hù)向 G1 發(fā)起一個(gè)寫(xiě)操作,將其改為 v1。
接下來(lái),用戶(hù)的讀操作就會(huì)得到 v1。這就叫一致性。
圖片
問(wèn)題是,用戶(hù)有可能向 G2 發(fā)起讀操作,由于 G2 的值沒(méi)有發(fā)生變化,因此返回的是 v0。G1 和 G2 讀操作的結(jié)果不一致,這就不滿(mǎn)足一致性了。
為了讓 G2 也能變?yōu)?v1,就要在 G1 寫(xiě)操作的時(shí)候,讓 G1 向 G2 發(fā)送一條消息,要求 G2 也改成 v1。
圖片
這樣的話,用戶(hù)向 G2 發(fā)起讀操作,也能得到 v1。
圖片
三、Availability
Availability 中文叫做"可用性",意思是只要收到用戶(hù)的請(qǐng)求,服務(wù)器就必須給出回應(yīng)。
用戶(hù)可以選擇向 G1 或 G2 發(fā)起讀操作。不管是哪臺(tái)服務(wù)器,只要收到請(qǐng)求,就必須告訴用戶(hù),到底是 v0 還是 v1,否則就不滿(mǎn)足可用性。
四、Consistency 和 Availability 的矛盾
一致性和可用性,為什么不可能同時(shí)成立?答案很簡(jiǎn)單,因?yàn)榭赡芡ㄐ攀。闯霈F(xiàn)分區(qū)容錯(cuò))。
如果保證 G2 的一致性,那么 G1 必須在寫(xiě)操作時(shí),鎖定 G2 的讀操作和寫(xiě)操作。只有數(shù)據(jù)同步后,才能重新開(kāi)放讀寫(xiě)。鎖定期間,G2 不能讀寫(xiě),沒(méi)有可用性不。
如果保證 G2 的可用性,那么勢(shì)必不能鎖定 G2,所以一致性不成立。
綜上所述,G2 無(wú)法同時(shí)做到一致性和可用性。系統(tǒng)設(shè)計(jì)時(shí)只能選擇一個(gè)目標(biāo)。如果追求一致性,那么無(wú)法保證所有節(jié)點(diǎn)的可用性;如果追求所有節(jié)點(diǎn)的可用性,那就沒(méi)法做到一致性。
在什么場(chǎng)合,可用性高于一致性?
舉例來(lái)說(shuō),發(fā)布一張網(wǎng)頁(yè)到 CDN,多個(gè)服務(wù)器有這張網(wǎng)頁(yè)的副本。后來(lái)發(fā)現(xiàn)一個(gè)錯(cuò)誤,需要更新網(wǎng)頁(yè),這時(shí)只能每個(gè)服務(wù)器都更新一遍。
一般來(lái)說(shuō),網(wǎng)頁(yè)的更新不是特別強(qiáng)調(diào)一致性。短時(shí)期內(nèi),一些用戶(hù)拿到老版本,另一些用戶(hù)拿到新版本,問(wèn)題不會(huì)特別大。當(dāng)然,所有人最終都會(huì)看到新版本。所以,這個(gè)場(chǎng)合就是可用性高于一致性。
五、驗(yàn)證CAP理論
系統(tǒng)總是會(huì)有錯(cuò)誤,那我們就來(lái)看看可能會(huì)出現(xiàn)什么錯(cuò)誤。
圖片
N1節(jié)點(diǎn)更新了V0到V1,想在也想把這個(gè)消息通過(guò)M操作告訴N1節(jié)點(diǎn),卻發(fā)生了網(wǎng)絡(luò)故障。這時(shí)候小明和小華都要同時(shí)訪問(wèn)這個(gè)數(shù)據(jù),怎么辦呢?現(xiàn)在我們依然想要我們的系統(tǒng)具有CAP三個(gè)特性,我們分析一下會(huì)發(fā)生什么。
(1)系統(tǒng)網(wǎng)絡(luò)發(fā)生了故障,但是系統(tǒng)依然可以訪問(wèn),因此具有容錯(cuò)性。
(2)小明在訪問(wèn)節(jié)點(diǎn)N1的時(shí)候更改了V0到V1,想要小華訪問(wèn)節(jié)點(diǎn)N2的V數(shù)據(jù)庫(kù)的時(shí)候是V1,因此需要等網(wǎng)絡(luò)故障恢復(fù),將N2節(jié)點(diǎn)的數(shù)據(jù)庫(kù)進(jìn)行更新才可以。
(3)在網(wǎng)絡(luò)故障恢復(fù)的這段時(shí)間內(nèi),想要系統(tǒng)滿(mǎn)足可用性,是不可能的。因?yàn)榭捎眯砸箅S時(shí)隨地訪問(wèn)系統(tǒng)都是正確有效的。這就出現(xiàn)了矛盾。
正是這個(gè)矛盾所以CAP三個(gè)特性肯定不能同時(shí)滿(mǎn)足。既然不能滿(mǎn)足,那我們就進(jìn)行取舍。
有兩種選擇:
(1)犧牲數(shù)據(jù)一致性,也就是小明看到的衣服數(shù)量是10,買(mǎi)了一件應(yīng)該是9了。但是小華看到的依然是10。
(2)犧牲可用性,也就是小明看到的衣服數(shù)量是10,買(mǎi)了一件應(yīng)該是9了。但是小華想要獲取的最新的數(shù)據(jù)的話,那就一直等待阻塞,一直到網(wǎng)絡(luò)故障恢復(fù)。
現(xiàn)在你可以看到了CAP三個(gè)特性肯定是不能同時(shí)滿(mǎn)足的,但是可以滿(mǎn)足其中兩個(gè)。
六、CAP特性的取舍
我們分析一下既然可以滿(mǎn)足兩個(gè),那么舍棄哪一個(gè)比較好呢?
(1)滿(mǎn)足CA舍棄P,也就是滿(mǎn)足一致性和可用性,舍棄容錯(cuò)性。但是這也就意味著你的系統(tǒng)不是分布式的了,因?yàn)樯婕胺植际降南敕ň褪前压δ芊珠_(kāi),部署到不同的機(jī)器上。
(2)滿(mǎn)足CP舍棄A,也就是滿(mǎn)足一致性和容錯(cuò)性,舍棄可用性。如果你的系統(tǒng)允許有段時(shí)間的訪問(wèn)失效等問(wèn)題,這個(gè)是可以滿(mǎn)足的。就好比多個(gè)人并發(fā)買(mǎi)票,后臺(tái)網(wǎng)絡(luò)出現(xiàn)故障,你買(mǎi)的時(shí)候系統(tǒng)就崩潰了。
(3)滿(mǎn)足AP舍棄C,也就是滿(mǎn)足可用性和容錯(cuò)性,舍棄一致性。這也就是意味著你的系統(tǒng)在并發(fā)訪問(wèn)的時(shí)候可能會(huì)出現(xiàn)數(shù)據(jù)不一致的情況。
實(shí)時(shí)證明,大多數(shù)都是犧牲了一致性。像12306還有淘寶網(wǎng),就好比是你買(mǎi)火車(chē)票,本來(lái)你看到的是還有一張票,其實(shí)在這個(gè)時(shí)刻已經(jīng)被買(mǎi)走了,你填好了信息準(zhǔn)備買(mǎi)的時(shí)候發(fā)現(xiàn)系統(tǒng)提示你沒(méi)票了。這就是犧牲了一致性。
但是不是說(shuō)犧牲一致性一定是最好的。就好比mysql中的事務(wù)機(jī)制,張三給李四轉(zhuǎn)了100塊錢(qián),這時(shí)候必須保證張三的賬戶(hù)上少了100,李四的賬戶(hù)多了100。因此需要數(shù)據(jù)的一致性,而且什么時(shí)候轉(zhuǎn)錢(qián)都可以,也需要可用性。但是可以轉(zhuǎn)錢(qián)失敗是可以允許的。















 
 
 










 
 
 
 