偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

基于MySQL復(fù)制的業(yè)務(wù)需求分析和改進(jìn)

運(yùn)維 數(shù)據(jù)庫運(yùn)維
今天和同事聊起了一個(gè)問題,主要背景是有2個(gè)數(shù)據(jù)庫需要數(shù)據(jù)流轉(zhuǎn)至數(shù)倉系統(tǒng),雖然數(shù)據(jù)庫的存儲(chǔ)容量很大,但是需要流轉(zhuǎn)的數(shù)據(jù)量不大。

 [[431099]]

今天和同事聊起了一個(gè)問題,主要背景是有2個(gè)數(shù)據(jù)庫需要數(shù)據(jù)流轉(zhuǎn)至數(shù)倉系統(tǒng),雖然數(shù)據(jù)庫的存儲(chǔ)容量很大,但是需要流轉(zhuǎn)的數(shù)據(jù)量不大,舉個(gè)例子,比如源數(shù)據(jù)庫有100張表占用800G,但是數(shù)據(jù)流轉(zhuǎn)只需要10張表,占用30G, 所以在構(gòu)建數(shù)據(jù)源集市的時(shí)候,我們就選擇了多源復(fù)制的模式,把兩個(gè)數(shù)據(jù)庫合在一起對(duì)外交付,本質(zhì)上還是基于主從復(fù)制的模式,只是更加靈活而已。

近期有個(gè)新需求,打破了這種平靜,現(xiàn)在需要新增幾張數(shù)據(jù)表流轉(zhuǎn)至數(shù)倉系統(tǒng),尷尬的是這幾張表因?yàn)闅v史原因沒有分表,單表的數(shù)據(jù)量在幾億,如果采用邏輯導(dǎo)出導(dǎo)入的方式,需要差不多5個(gè)小時(shí)左右,而且最關(guān)鍵的是,還帶來了一系列問題:

1)這種數(shù)據(jù)導(dǎo)出導(dǎo)入的模式,數(shù)據(jù)導(dǎo)入完成后的數(shù)據(jù)補(bǔ)齊工作很難,因?yàn)閿?shù)據(jù)是從主庫復(fù)制,所以這個(gè)中間節(jié)點(diǎn)上面始終是一種動(dòng)態(tài)的數(shù)據(jù)處理過程,從理論上來說,是沒有辦法追齊數(shù)據(jù)的

2)數(shù)據(jù)復(fù)制基于GTID,什么時(shí)候該做取舍也是個(gè)難題,比如其他的10張表在實(shí)時(shí)復(fù)制,而新增的表會(huì)產(chǎn)生新的GTID,在數(shù)據(jù)沒有應(yīng)用過來之前,會(huì)有一系列的GTID無法自動(dòng)修復(fù)。

如果把這個(gè)圖畫的更全面一些,其實(shí)是這樣的結(jié)構(gòu),默認(rèn)是有數(shù)據(jù)的容災(zāi)節(jié)點(diǎn)的,中間節(jié)點(diǎn)是直接從主庫進(jìn)行數(shù)據(jù)復(fù)制的。

要解決現(xiàn)在的這個(gè)問題,導(dǎo)出導(dǎo)入5個(gè)小時(shí)顯然是不合理的,而相對(duì)來說理想的方式便是基于物理數(shù)據(jù)的處理模式。

一種是傳輸表空間,直接把ibd文件拷貝到中間節(jié)點(diǎn),然后修復(fù)數(shù)據(jù)的差異,這個(gè)時(shí)候有兩種修復(fù)差值的模式,一種是基于表中的增量時(shí)間來處理,相對(duì)不夠通用,第二種則是更嚴(yán)謹(jǐn)?shù)哪J?,則是修改數(shù)據(jù)的復(fù)制鏈路,基于從庫級(jí)聯(lián)復(fù)制即可。

這里的關(guān)鍵便是在開啟傳輸表空間前就停止slave復(fù)制,讓整個(gè)系統(tǒng)處于靜止?fàn)顟B(tài),這樣能夠保證數(shù)據(jù)的完整性,這個(gè)過程如果是復(fù)制ibd文件,30G左右的文件大概30分鐘就能搞定。

復(fù)制完成后,可以根據(jù)需求是繼續(xù)保留基于從庫復(fù)制還是重新調(diào)整GTID綁定到主庫端去。

最終的變更狀態(tài)和原來基本保持一致。

第二種處理模式簡單直接,即需要尋找數(shù)據(jù)問題的根因,比如源庫有100張表占用800G,但是需要流轉(zhuǎn)10張表占用30G,那么我們是不是可以直接基于數(shù)據(jù)庫級(jí),實(shí)例級(jí)進(jìn)行數(shù)據(jù)復(fù)制,等數(shù)據(jù)復(fù)制狀態(tài)正常后我們把那90張表都清理掉,在處理過程中,對(duì)于一些可能出現(xiàn)的復(fù)制異常編碼進(jìn)行統(tǒng)一的過濾處理。這樣我們的數(shù)據(jù)始終是實(shí)時(shí)更新的狀態(tài),無論是狀態(tài)性數(shù)據(jù)實(shí)時(shí)更新還是日志型數(shù)據(jù)實(shí)時(shí)更新都可以靈活的適配。

同時(shí)在這個(gè)時(shí)候我們對(duì)于多源復(fù)制也可以做一些取舍,在這種場景下我覺得使用的意義就不是很大了。

綜上,數(shù)據(jù)復(fù)制是一個(gè)很好的數(shù)據(jù)開關(guān),能夠靈活的適配和處理很多偏向于業(yè)務(wù)需求的數(shù)據(jù)邏輯,在這個(gè)過程中,基于系統(tǒng)層,物理的處理模式要遠(yuǎn)比邏輯處理要高效的多。

責(zé)任編輯:張燕妮 來源: 楊建榮的學(xué)習(xí)筆記
相關(guān)推薦

2017-11-15 08:00:39

MySQL數(shù)據(jù)清理需求分析

2009-03-27 09:59:00

2010-06-09 12:36:30

UML業(yè)務(wù)建模實(shí)例

2019-11-04 18:52:04

Gartner數(shù)字化分析

2024-08-26 14:54:54

2022-05-09 09:00:00

Splunk數(shù)據(jù)分析工具

2014-08-18 15:41:53

IT業(yè)務(wù)需求

2010-02-26 15:09:59

Linux NFS

2009-06-14 17:56:56

ibmdwWebSphere

2020-12-01 14:28:48

水滴業(yè)務(wù)場景

2017-08-15 17:34:26

安全運(yùn)營安全分析網(wǎng)絡(luò)安全

2023-09-18 16:14:35

性能測試開發(fā)

2009-06-03 14:00:51

ibmdwWebSphere業(yè)務(wù)

2018-09-07 08:30:33

2024-02-06 08:18:30

用戶畫像標(biāo)簽數(shù)字化異常值處理

2017-06-23 22:00:13

MySqlsslcentos

2009-03-18 11:06:56

8020法則需求分析

2009-11-05 13:42:44

BSM

2018-10-08 14:16:38

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)