一文搞懂Undo Log版本鏈與ReadView機制如何讓事務讀取到該讀的數(shù)據(jù)
本文轉載自微信公眾號「菜鳥飛呀飛」,作者劉進坤。轉載本文請聯(lián)系菜鳥飛呀飛公眾號。
undo log 版本鏈
在 MySQL 的數(shù)據(jù)表中,存儲著一行行的數(shù)據(jù)記錄,對每行數(shù)據(jù)而言,不僅僅記錄著我們定義的字段值,還會隱藏兩個字段:row_trx_id 和 roll_pointer,前者表示更新本行數(shù)據(jù)的事務 id,后者表示的是回滾指針,它指向的是該行數(shù)據(jù)上一個版本的 undo log(如果不明白這是什么,可以先繼續(xù)往后看)。
對于每行有兩個隱藏的字段,在《高性能 MySQL》第三版的第 13 頁中把它們叫做數(shù)據(jù)的更新時間和過期時間,這兩個字段存儲的不是真實的時間,而是事務的版本號。
這與本文 row_trx_id 和 roll_pointer 的叫法差異很大,實際上,不用在意這兩個字段具體叫什么,反正它們都是為了實現(xiàn) MVCC 機制而設計的。
我個人覺得把它們分別叫做 row_trx_id 和 roll_pointer,會更容易理解一點。
我們知道,當我們進行數(shù)據(jù)的新增、刪除、修改操作時,會寫 redo log(解決數(shù)據(jù)庫宕機重啟丟失數(shù)據(jù)的問題)和 binlog(主要用來做復制、數(shù)據(jù)備份等操作),另外還會寫 undo log,它是為了實現(xiàn)事務的回滾操作。
每一條 undo log 的具體內(nèi)容本文今天先不解釋,有興趣的同學可以自行網(wǎng)上查閱。我們只需要知道每行 undo log 日志會記錄對應的事務 id,還會記錄當前事務將數(shù)據(jù)修改后的最新值,以及指向當前行數(shù)據(jù)上一個版本的 undo log 的指針,也就是 roll_pointer。
為了方便理解,每一行 undo log 可以簡化為下圖所示的結構:
圖1
舉個例子,現(xiàn)在有一個事務 A,它的事務 id 為 10,向表中新插入了一條數(shù)據(jù),數(shù)據(jù)記為 data_A,那么此時對應的 undo log 應該如下圖所示:
圖2
由于是新插入的一條數(shù)據(jù),所以這行數(shù)據(jù)是第一個版本,也就是它沒有上一個數(shù)據(jù)版本,因此它的 roll_pointer 為 null。
接著事務 B(trx_id=20),將這行數(shù)據(jù)的值修改為 data_B,同樣也會記錄一條 undo log,如下圖所示,這條 undo log 的 roll_pointer 指針會指向上一個數(shù)據(jù)版本的 undo log,也就是指向事務 A 寫入的那一行 undo log。
圖3
再接著,事務 C(trx_id=30),將這行數(shù)據(jù)的值修改為 data_C,對應的示意圖如下。
圖4
只要有事務修改了這一行的數(shù)據(jù),那么就會記錄一條對應的 undo log,一條 undo log 對應這行數(shù)據(jù)的一個版本,當這行數(shù)據(jù)有多個版本時,就會有多條 undo log 日志,undo log 之間通過 roll_pointer 指針連接,這樣就形成了一個 undo log 版本鏈
ReadView 機制
當事務在開始執(zhí)行的時候,會給每個事務生成一個 ReadView。這個 ReadView 會記錄 4 個非常重要的屬性:
- creator_trx_id: 當前事務的 id;
 - m_ids: 當前系統(tǒng)中所有的活躍事務的 id,活躍事務指的是當前系統(tǒng)中開啟了事務,但是還沒有提交的事務;
 - min_trx_id: 當前系統(tǒng)中,所有活躍事務中事務 id 最小的那個事務,也就是 m_id 數(shù)組中最小的事務 id;
 - max_trx_id: 當前系統(tǒng)中事務的 id 值最大的那個事務 id 值再加 1,也就是系統(tǒng)中下一個要生成的事務 id。
 
ReadView 會根據(jù)這 4 個屬性,再結合 undo log 版本鏈,來實現(xiàn) MVCC 機制,決定讓一個事務能讀取到哪些數(shù)據(jù),不能讀取到哪些數(shù)據(jù)。
那么到底是如何來實現(xiàn)的呢?
如果用一個坐標軸來表示的話,min_trx_id 和 max_trx_id 會將這個坐標軸分成 3 個部分:
圖5
當一個事務讀取某條數(shù)據(jù)時,就會按照如下規(guī)則來決定當前事務能讀取到什么數(shù)據(jù):
- 如果當前數(shù)據(jù)的 row_trx_id 小于 min_trx_id,那么表示這條數(shù)據(jù)是在當前事務開啟之前,其他的事務就已經(jīng)將該條數(shù)據(jù)修改了并提交了事務(事務的 id 值是遞增的),所以當前事務能讀取到。
 - 如果當前數(shù)據(jù)的 row_trx_id 大于等于 max_trx_id,那么表示在當前事務開啟以后,過了一段時間,系統(tǒng)中有新的事務開啟了,并且新的事務修改了這行數(shù)據(jù)的值并提交了事務,所以當前事務肯定是不能讀取到的,因此這是后面的事務修改提交的數(shù)據(jù)。
 - 如果當前數(shù)據(jù)的 row_trx_id 處于 min_trx_id 和 max_trx_id 的范圍之間,又需要分兩種情況:
 
(a)row_trx_id 在 m_ids 數(shù)組中,那么當前事務不能讀取到。為什么呢?row_trx_id 在 m_ids 數(shù)組中表示的是和當前事務在同一時刻開啟的事務,修改了數(shù)據(jù)的值,并提交了事務,所以不能讓當前事務讀取到;
(b) row_trx_id 不在 m_ids 數(shù)組中,那么當前事務能讀取到。row_trx_id 不在 m_ids 數(shù)組中表示的是在當前事務開啟之前,其他事務將數(shù)據(jù)修改后就已經(jīng)提交了事務,所以當前事務能讀取到。
注意:如果 row_trx_id 等于當前事務的 id,那表示這條數(shù)據(jù)就是當前事務修改的,那當前事務肯定能讀取到啊。
這里可能有人會有一個疑惑,事務的 id 值是遞增的,那么在什么場景下,row_trx_id 處于 min_trx_id 和 max_trx_id 之間,但是卻又不再 m_id 數(shù)組內(nèi)呢?
這個問題也是困擾了我很長一段時間,最近終于想通了,答案就是在讀提交的事務隔離級別下,會出現(xiàn)這種現(xiàn)象。
至于為什么,需要看完這一篇文章以及下下一篇文章《在讀提交的事務隔離級別下,MVCC 機制是如何工作的?》,才能明白為什么。
下面舉幾個例子,來解釋一下 ReadView 機制下,數(shù)據(jù)的讀取規(guī)則。先假設表中有一條數(shù)據(jù),它的 row_trx_id=10,roll_pointer 為 null,那么此時 undo log 版本鏈就是下圖這樣:
圖6
假設現(xiàn)在有事務 A 和事務 B 并發(fā)執(zhí)行,事務 A 的事務 id 為 20,事務 B 的事務 id 為 30。
那么此時對于事務 A 而言,它的 ReadView 中,m_ids=[20,30],min_trx_id=20,max_trx_id=31,creator_trx_id=20。
對于事務 B 而言,它的 ReadView 中,m_ids=[20,30],min_trx_id=20,max_trx_id=31,creator_trx_id=30。
如果此時事務 A(trx_id=20)去讀取數(shù)據(jù),那么在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 10,這個值小于事務 A 的 ReadView 里 min_trx_id 的值,這表示這個數(shù)據(jù)的版本是事務 A 開啟之前,其他事務提交的,因此事務 A 可以讀取到,所以讀取到的值是 data0。
圖7
接著事務 B(trx_id=30)去修改數(shù)據(jù),將數(shù)據(jù)修改為 data_B,先不提交事務。雖然不提交事務,但是仍然會記錄一條 undo log,因此這條數(shù)據(jù)的 undo log 的版本鏈就有兩條記錄了,新的這條 undo log 的 roll_pointer 指針會指向前一條 undo log,示意圖如下。
圖8
接著事務 A(trx_id=20)去讀取數(shù)據(jù),那么在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 30,這個值處于事務 A 的 ReadView 里 min_trx_id 和 max_trx_id 之間,因此還需要判斷這個數(shù)據(jù)版本的值是否在 m_ids 數(shù)組中,結果發(fā)現(xiàn),30 確實在 m_ids 數(shù)組中,這表示這個版本的數(shù)據(jù)是和自己同一時刻啟動的事務修改的,因此這個版本的數(shù)據(jù),數(shù)據(jù) A 讀取不到。所以需要沿著 undo log 的版本鏈向前找,接著會找到該行數(shù)據(jù)的上一個版本,也就是 trx_id=10 的版本,由于這個版本的數(shù)據(jù)的 trx_id=10,小于 min_trx_id 的值,因此事務 A 能讀取到該版本的值,即事務 A 讀取到的值是 data0。
圖9
緊接著事務 B 提交事務,那么此時系統(tǒng)中活躍的事務就只有 id 為 20 的事務了,也就是事務 A。那么此時事務 A 再去讀取數(shù)據(jù),它能讀取到什么值呢?還是 data0。為什么呢?
雖然系統(tǒng)中當前只剩下 id 為 20 的活躍事務了,但是事務 A 開啟的瞬間,它已經(jīng)生成了 ReadView ,后面即使有其他事務提交了,但是事務 A 的 ReadView 不會修改,也就是 m_ids 不會變,還是 m_ids=[20,30],所以此時事務 A 去根據(jù) undo log 版本鏈去讀取數(shù)據(jù)時,還是不能讀取最新版本的數(shù)據(jù),只能往前找,最終還是只能讀取到 data0。
接著系統(tǒng)中,新開了一個事務 C,事務 id 為 40,它的 ReadView 中,m_ids=[20,40],min_trx_id=20,max_trx_id=41,creator_trx_id=40。
然后事務 C(trx_id=40)將數(shù)據(jù)修改為 data_C,并提交事務。此時 undo log 版本鏈就變成了如下圖所示。
圖10
此時事務 A(trx_id=20)去讀取數(shù)據(jù),那么在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 40,由于此時事務 A 的 ReadView 中的 max_trx_id=31,40 大于 31,這表示當前版本的數(shù)據(jù)時在事務 A 之后提交的,因此對于事務 A 肯定是不能讀取到的。所以此時事務 A 只能根據(jù) roll_pointer 指針,沿著 undo log 版本向前找,結果發(fā)現(xiàn)上一個版本的 trx_id=30,自己還是不能讀取到,所以再繼續(xù)往前找,最終可以讀取到 trx_id=10 的版本數(shù)據(jù),因此最終事務 A 只能讀取到 data0。
圖11
接著事務 A(trx_id=20)去修改數(shù)據(jù),將數(shù)據(jù)修改為 data_A,那么就會記錄一條 undo log,示意圖如下:
圖12
然后事務 A(trx_id=20)再去讀取數(shù)據(jù),在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 20,事務 A 一對比,發(fā)現(xiàn)該版本的事務 id 與自己的事務 id 相等,這表示這個版本的數(shù)據(jù)就是自己修改的,既然是自己修改的,那就肯定能讀取到了,因此此時讀取到是 data_A。
圖13
總結
總結一下,本文主要講解了 undo log 版本鏈是如何形成的,然后講解了 ReadView 的機制是什么,通過幾個例子,配合畫圖,詳細分析了 ReadView 結合 undo log 版本鏈是如何來實現(xiàn)讓當前事務讀取到哪一個版本的數(shù)據(jù)的,這也就是 MVCC 機制的核心實現(xiàn)原理。
但是到目前為止,只是分析了 ReadView 和 undo log 是如何來實現(xiàn) MVCC 機制,如何控制事務怎么讀取數(shù)據(jù),還沒有結合在具體的事務隔離級別下,MVCC 機制是如何工作的。




























 
 
 















 
 
 
 