我C,一個庫里Curry幾百個表,這誰受得了?
隨著業(yè)務(wù)越來越復(fù)雜,數(shù)據(jù)量越來越大,并發(fā)量越來越大,數(shù)據(jù)庫的性能越來越低。好不容易找運維申請了兩臺機(jī)器,讓DBA部署了幾個實例,想把一些業(yè)務(wù)庫拆分出來,卻發(fā)現(xiàn)一個庫里幾百個表,拆不出來,擴(kuò)不了容,尷尬!
因為數(shù)據(jù)庫強(qiáng)關(guān)聯(lián)在一起,無法通過增加數(shù)據(jù)庫實例擴(kuò)容,就是一個耦合的典型案例。
什么樣的場景會出現(xiàn)這類耦合?
舉個栗子。
有一個公共用戶數(shù)據(jù)庫DB_USER,里面table_user存放了通用的用戶數(shù)據(jù):
- table_user (uid, name, passwd, …)
在數(shù)據(jù)量比較小,并發(fā)量比較小,業(yè)務(wù)還沒有這么復(fù)雜的時候,為了提高資源利用率(程序員才沒有考慮什么資源利用率,更多的是圖方便),業(yè)務(wù)A把用戶個性化的數(shù)據(jù)也放在這個庫里:
- table_A(uid, A業(yè)務(wù)的個性化屬性)
業(yè)務(wù)A有一個需求,即要展現(xiàn)用戶公共屬性,又要展現(xiàn)業(yè)務(wù)A個性化屬性,程序員經(jīng)常這么實現(xiàn)的:
- select * from table_user, table_A
- where table_user.uid = table_A.uid
- and table_user.uid = $uid
初期關(guān)聯(lián)查詢沒有任何問題,單條記錄訪問,命中索引,一次查詢所有數(shù)據(jù),簡單高效。
如何產(chǎn)生各業(yè)務(wù)數(shù)據(jù)耦合?
通過join實現(xiàn)業(yè)務(wù),導(dǎo)致通用表table_user和業(yè)務(wù)表table_A必須存在于一個數(shù)據(jù)庫實例里。
如果業(yè)務(wù)B也這么做,業(yè)務(wù)C也這么做,會導(dǎo)致公用業(yè)務(wù),業(yè)務(wù)A,業(yè)務(wù)B,業(yè)務(wù)C都必須存在于一個數(shù)據(jù)庫實例里。
會產(chǎn)生什么潛在問題呢?
假如A業(yè)務(wù)線上線了一個新功能,不小心進(jìn)行了全表掃描,導(dǎo)致數(shù)據(jù)庫CPU100%,數(shù)據(jù)庫實例性能下降,由于實例共用,通用業(yè)務(wù),業(yè)務(wù)B和業(yè)務(wù)C都會受影響。
即某個業(yè)務(wù)線的數(shù)據(jù)庫性能急劇下降導(dǎo)致所有業(yè)務(wù)都受影響,這種耦合,歷史總是驚人的相似:
- 業(yè)務(wù)B的大boss在群里首先發(fā)飆:“技術(shù)都干啥了,怎么系統(tǒng)掛了”
- 業(yè)務(wù)B的rd一臉無辜:“業(yè)務(wù)A上線了,所以我們掛了”
額,然而,這個理由,好像在大boss那解釋不通…
- 業(yè)務(wù)B的大boss:“趕緊加幾臺機(jī)器,拆分開”
- 業(yè)務(wù)B的rd一臉無奈:“加機(jī)器加實例也擴(kuò)容不了”
- 業(yè)務(wù)B的大boss對業(yè)務(wù)2的rd吼道“還想甩鍋,拖出去祭天”
- ...
唉,加了幾臺機(jī)器,加了幾個實例,然而并沒有什么卵用,都耦合在一個實例里,完全擴(kuò)不了容。
那,如何解除公共數(shù)據(jù)庫與業(yè)務(wù)數(shù)據(jù)庫的耦合?
第一步:公共數(shù)據(jù)訪問下沉服務(wù)化。
還是上面的例子,當(dāng)公共的user數(shù)據(jù)訪問服務(wù)化之后,依據(jù)服務(wù)化的原則:
- 業(yè)務(wù)層只能通過服務(wù)RPC接口訪問數(shù)據(jù);
- 底層user庫屬于user服務(wù)私有;
- 任何上游不允許跨過服務(wù)訪問底層的user庫;
第二步:垂直拆分,個性化數(shù)據(jù)訪問上浮。
原來業(yè)務(wù)方:通過join一次性獲取通用的數(shù)據(jù)和個性化的業(yè)務(wù)數(shù)據(jù)數(shù)據(jù)。
服務(wù)化+垂直拆分后,變成兩次訪問:
- 一次取得業(yè)務(wù)數(shù)據(jù)(業(yè)務(wù)可以直接調(diào)用自己的數(shù)據(jù)庫,也可以自己做業(yè)務(wù)服務(wù)調(diào)用RPC接口);
- 一次取得共性數(shù)據(jù)(調(diào)用通用的RPC接口);
兩種方式相比:
- 之前的方式其實業(yè)務(wù)代碼可能會更簡單一些,因為它是將這個業(yè)務(wù)邏輯放在了SQL語句中,但是導(dǎo)致數(shù)據(jù)庫耦合在了一起;
- 后面這種方式就是業(yè)務(wù)的代碼會更復(fù)雜,會變成多次訪問,將原來在SQL中進(jìn)行的邏輯計算變成業(yè)務(wù)代碼中的邏輯計算,但是數(shù)據(jù)庫解耦了;
業(yè)務(wù)復(fù)雜,數(shù)據(jù)量大,并發(fā)老大,對擴(kuò)展性要求更高的架構(gòu),一定是后者。
此時各業(yè)務(wù)有自己的庫,公共有公共的庫:
- 早期:可以放在一個數(shù)據(jù)庫實例里;
- 后期:可以很容易地通過新增數(shù)據(jù)庫實例,把user庫或者業(yè)務(wù)A/B/C的庫拆分出來,實現(xiàn)增加機(jī)器增加實例就實現(xiàn)擴(kuò)容;
個性業(yè)務(wù)數(shù)據(jù)訪問垂直拆分,共性數(shù)據(jù)訪問服務(wù)化下沉,只是一個很小的優(yōu)化點,但對于數(shù)據(jù)庫解耦卻是非常的有效。
希望大家每天收獲一點點,這樣架構(gòu)就能美好一點點。
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】