偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一文搞懂Undo Log版本鏈與ReadView機制如何讓事務讀取到該讀的數(shù)據(jù)

運維 數(shù)據(jù)庫運維
在 MySQL 的數(shù)據(jù)表中,存儲著一行行的數(shù)據(jù)記錄,對每行數(shù)據(jù)而言,不僅僅記錄著我們定義的字段值,還會隱藏兩個字段:row_trx_id 和 roll_pointer,前者表示更新本行數(shù)據(jù)的事務 id,后者表示的是回滾指針,它指向的是該行數(shù)據(jù)上一個版本的 undo log(如果不明白這是什么,可以先繼續(xù)往后看)。

[[376055]]

本文轉載自微信公眾號「菜鳥飛呀飛」,作者劉進坤。轉載本文請聯(lián)系菜鳥飛呀飛公眾號。   

 undo log 版本鏈

在 MySQL 的數(shù)據(jù)表中,存儲著一行行的數(shù)據(jù)記錄,對每行數(shù)據(jù)而言,不僅僅記錄著我們定義的字段值,還會隱藏兩個字段:row_trx_id 和 roll_pointer,前者表示更新本行數(shù)據(jù)的事務 id,后者表示的是回滾指針,它指向的是該行數(shù)據(jù)上一個版本的 undo log(如果不明白這是什么,可以先繼續(xù)往后看)。

對于每行有兩個隱藏的字段,在《高性能 MySQL》第三版的第 13 頁中把它們叫做數(shù)據(jù)的更新時間和過期時間,這兩個字段存儲的不是真實的時間,而是事務的版本號。

這與本文 row_trx_id 和 roll_pointer 的叫法差異很大,實際上,不用在意這兩個字段具體叫什么,反正它們都是為了實現(xiàn) MVCC 機制而設計的。

我個人覺得把它們分別叫做 row_trx_id 和 roll_pointer,會更容易理解一點。

我們知道,當我們進行數(shù)據(jù)的新增、刪除、修改操作時,會寫 redo log(解決數(shù)據(jù)庫宕機重啟丟失數(shù)據(jù)的問題)和 binlog(主要用來做復制、數(shù)據(jù)備份等操作),另外還會寫 undo log,它是為了實現(xiàn)事務的回滾操作。

每一條 undo log 的具體內(nèi)容本文今天先不解釋,有興趣的同學可以自行網(wǎng)上查閱。我們只需要知道每行 undo log 日志會記錄對應的事務 id,還會記錄當前事務將數(shù)據(jù)修改后的最新值,以及指向當前行數(shù)據(jù)上一個版本的 undo log 的指針,也就是 roll_pointer。

為了方便理解,每一行 undo log 可以簡化為下圖所示的結構:

圖1

 

舉個例子,現(xiàn)在有一個事務 A,它的事務 id 為 10,向表中新插入了一條數(shù)據(jù),數(shù)據(jù)記為 data_A,那么此時對應的 undo log 應該如下圖所示:

圖2

 

由于是新插入的一條數(shù)據(jù),所以這行數(shù)據(jù)是第一個版本,也就是它沒有上一個數(shù)據(jù)版本,因此它的 roll_pointer 為 null。

接著事務 B(trx_id=20),將這行數(shù)據(jù)的值修改為 data_B,同樣也會記錄一條 undo log,如下圖所示,這條 undo log 的 roll_pointer 指針會指向上一個數(shù)據(jù)版本的 undo log,也就是指向事務 A 寫入的那一行 undo log。

圖3

 

再接著,事務 C(trx_id=30),將這行數(shù)據(jù)的值修改為 data_C,對應的示意圖如下。

圖4

 

只要有事務修改了這一行的數(shù)據(jù),那么就會記錄一條對應的 undo log,一條 undo log 對應這行數(shù)據(jù)的一個版本,當這行數(shù)據(jù)有多個版本時,就會有多條 undo log 日志,undo log 之間通過 roll_pointer 指針連接,這樣就形成了一個 undo log 版本鏈

ReadView 機制

當事務在開始執(zhí)行的時候,會給每個事務生成一個 ReadView。這個 ReadView 會記錄 4 個非常重要的屬性:

  1. creator_trx_id: 當前事務的 id;
  2. m_ids: 當前系統(tǒng)中所有的活躍事務的 id,活躍事務指的是當前系統(tǒng)中開啟了事務,但是還沒有提交的事務;
  3. min_trx_id: 當前系統(tǒng)中,所有活躍事務中事務 id 最小的那個事務,也就是 m_id 數(shù)組中最小的事務 id;
  4. max_trx_id: 當前系統(tǒng)中事務的 id 值最大的那個事務 id 值再加 1,也就是系統(tǒng)中下一個要生成的事務 id。

ReadView 會根據(jù)這 4 個屬性,再結合 undo log 版本鏈,來實現(xiàn) MVCC 機制,決定讓一個事務能讀取到哪些數(shù)據(jù),不能讀取到哪些數(shù)據(jù)。

那么到底是如何來實現(xiàn)的呢?

如果用一個坐標軸來表示的話,min_trx_id 和 max_trx_id 會將這個坐標軸分成 3 個部分:

圖5

 

當一個事務讀取某條數(shù)據(jù)時,就會按照如下規(guī)則來決定當前事務能讀取到什么數(shù)據(jù):

  1. 如果當前數(shù)據(jù)的 row_trx_id 小于 min_trx_id,那么表示這條數(shù)據(jù)是在當前事務開啟之前,其他的事務就已經(jīng)將該條數(shù)據(jù)修改了并提交了事務(事務的 id 值是遞增的),所以當前事務能讀取到。
  2. 如果當前數(shù)據(jù)的 row_trx_id 大于等于 max_trx_id,那么表示在當前事務開啟以后,過了一段時間,系統(tǒng)中有新的事務開啟了,并且新的事務修改了這行數(shù)據(jù)的值并提交了事務,所以當前事務肯定是不能讀取到的,因此這是后面的事務修改提交的數(shù)據(jù)。
  3. 如果當前數(shù)據(jù)的 row_trx_id 處于 min_trx_id 和 max_trx_id 的范圍之間,又需要分兩種情況:

(a)row_trx_id 在 m_ids 數(shù)組中,那么當前事務不能讀取到。為什么呢?row_trx_id 在 m_ids 數(shù)組中表示的是和當前事務在同一時刻開啟的事務,修改了數(shù)據(jù)的值,并提交了事務,所以不能讓當前事務讀取到;

(b) row_trx_id 不在 m_ids 數(shù)組中,那么當前事務能讀取到。row_trx_id 不在 m_ids 數(shù)組中表示的是在當前事務開啟之前,其他事務將數(shù)據(jù)修改后就已經(jīng)提交了事務,所以當前事務能讀取到。

注意:如果 row_trx_id 等于當前事務的 id,那表示這條數(shù)據(jù)就是當前事務修改的,那當前事務肯定能讀取到啊。

這里可能有人會有一個疑惑,事務的 id 值是遞增的,那么在什么場景下,row_trx_id 處于 min_trx_id 和 max_trx_id 之間,但是卻又不再 m_id 數(shù)組內(nèi)呢?

這個問題也是困擾了我很長一段時間,最近終于想通了,答案就是在讀提交的事務隔離級別下,會出現(xiàn)這種現(xiàn)象。

至于為什么,需要看完這一篇文章以及下下一篇文章《在讀提交的事務隔離級別下,MVCC 機制是如何工作的?》,才能明白為什么。

下面舉幾個例子,來解釋一下 ReadView 機制下,數(shù)據(jù)的讀取規(guī)則。先假設表中有一條數(shù)據(jù),它的 row_trx_id=10,roll_pointer 為 null,那么此時 undo log 版本鏈就是下圖這樣:

圖6

 

假設現(xiàn)在有事務 A 和事務 B 并發(fā)執(zhí)行,事務 A 的事務 id 為 20,事務 B 的事務 id 為 30。

那么此時對于事務 A 而言,它的 ReadView 中,m_ids=[20,30],min_trx_id=20,max_trx_id=31,creator_trx_id=20。

對于事務 B 而言,它的 ReadView 中,m_ids=[20,30],min_trx_id=20,max_trx_id=31,creator_trx_id=30。

如果此時事務 A(trx_id=20)去讀取數(shù)據(jù),那么在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 10,這個值小于事務 A 的 ReadView 里 min_trx_id 的值,這表示這個數(shù)據(jù)的版本是事務 A 開啟之前,其他事務提交的,因此事務 A 可以讀取到,所以讀取到的值是 data0。

圖7

 

接著事務 B(trx_id=30)去修改數(shù)據(jù),將數(shù)據(jù)修改為 data_B,先不提交事務。雖然不提交事務,但是仍然會記錄一條 undo log,因此這條數(shù)據(jù)的 undo log 的版本鏈就有兩條記錄了,新的這條 undo log 的 roll_pointer 指針會指向前一條 undo log,示意圖如下。

圖8

 

接著事務 A(trx_id=20)去讀取數(shù)據(jù),那么在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 30,這個值處于事務 A 的 ReadView 里 min_trx_id 和 max_trx_id 之間,因此還需要判斷這個數(shù)據(jù)版本的值是否在 m_ids 數(shù)組中,結果發(fā)現(xiàn),30 確實在 m_ids 數(shù)組中,這表示這個版本的數(shù)據(jù)是和自己同一時刻啟動的事務修改的,因此這個版本的數(shù)據(jù),數(shù)據(jù) A 讀取不到。所以需要沿著 undo log 的版本鏈向前找,接著會找到該行數(shù)據(jù)的上一個版本,也就是 trx_id=10 的版本,由于這個版本的數(shù)據(jù)的 trx_id=10,小于 min_trx_id 的值,因此事務 A 能讀取到該版本的值,即事務 A 讀取到的值是 data0。

圖9

 

緊接著事務 B 提交事務,那么此時系統(tǒng)中活躍的事務就只有 id 為 20 的事務了,也就是事務 A。那么此時事務 A 再去讀取數(shù)據(jù),它能讀取到什么值呢?還是 data0。為什么呢?

雖然系統(tǒng)中當前只剩下 id 為 20 的活躍事務了,但是事務 A 開啟的瞬間,它已經(jīng)生成了 ReadView ,后面即使有其他事務提交了,但是事務 A 的 ReadView 不會修改,也就是 m_ids 不會變,還是 m_ids=[20,30],所以此時事務 A 去根據(jù) undo log 版本鏈去讀取數(shù)據(jù)時,還是不能讀取最新版本的數(shù)據(jù),只能往前找,最終還是只能讀取到 data0。

接著系統(tǒng)中,新開了一個事務 C,事務 id 為 40,它的 ReadView 中,m_ids=[20,40],min_trx_id=20,max_trx_id=41,creator_trx_id=40。

然后事務 C(trx_id=40)將數(shù)據(jù)修改為 data_C,并提交事務。此時 undo log 版本鏈就變成了如下圖所示。

圖10

 

此時事務 A(trx_id=20)去讀取數(shù)據(jù),那么在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 40,由于此時事務 A 的 ReadView 中的 max_trx_id=31,40 大于 31,這表示當前版本的數(shù)據(jù)時在事務 A 之后提交的,因此對于事務 A 肯定是不能讀取到的。所以此時事務 A 只能根據(jù) roll_pointer 指針,沿著 undo log 版本向前找,結果發(fā)現(xiàn)上一個版本的 trx_id=30,自己還是不能讀取到,所以再繼續(xù)往前找,最終可以讀取到 trx_id=10 的版本數(shù)據(jù),因此最終事務 A 只能讀取到 data0。

 


圖11

 

 

接著事務 A(trx_id=20)去修改數(shù)據(jù),將數(shù)據(jù)修改為 data_A,那么就會記錄一條 undo log,示意圖如下:

 

 


圖12

 

 

然后事務 A(trx_id=20)再去讀取數(shù)據(jù),在 undo log 版本鏈中,數(shù)據(jù)最新版本的事務 id 為 20,事務 A 一對比,發(fā)現(xiàn)該版本的事務 id 與自己的事務 id 相等,這表示這個版本的數(shù)據(jù)就是自己修改的,既然是自己修改的,那就肯定能讀取到了,因此此時讀取到是 data_A。

圖13

 

總結

總結一下,本文主要講解了 undo log 版本鏈是如何形成的,然后講解了 ReadView 的機制是什么,通過幾個例子,配合畫圖,詳細分析了 ReadView 結合 undo log 版本鏈是如何來實現(xiàn)讓當前事務讀取到哪一個版本的數(shù)據(jù)的,這也就是 MVCC 機制的核心實現(xiàn)原理。

但是到目前為止,只是分析了 ReadView 和 undo log 是如何來實現(xiàn) MVCC 機制,如何控制事務怎么讀取數(shù)據(jù),還沒有結合在具體的事務隔離級別下,MVCC 機制是如何工作的。

責任編輯:武曉燕 來源: 菜鳥飛呀飛
相關推薦

2022-04-26 08:00:58

undo日Atomicity事務

2024-01-30 13:15:00

設計模式責任鏈

2024-09-26 07:27:27

2020-05-15 16:37:13

PowerBI數(shù)據(jù)分析

2022-03-24 08:51:48

Redis互聯(lián)網(wǎng)NoSQL

2025-06-04 03:21:00

RAGRetrievalGeneratio

2022-04-26 13:41:16

區(qū)塊鏈比特幣數(shù)據(jù)庫

2024-04-12 12:19:08

語言模型AI

2021-10-20 08:49:30

Vuexvue.js狀態(tài)管理模式

2023-12-06 08:23:16

MVCCmysql

2025-01-15 13:19:09

MySQL日志事務

2019-04-03 09:27:01

MySQLInnoDB務ACID

2025-01-16 10:38:31

2025-01-16 00:20:41

2021-03-22 10:05:59

netstat命令Linux

2023-09-15 12:00:01

API應用程序接口

2023-09-08 08:20:46

ThreadLoca多線程工具

2018-03-17 09:00:21

大數(shù)據(jù) 區(qū)塊鏈

2021-07-28 10:41:21

python

2023-07-04 08:56:07

指針類型Golang
點贊
收藏

51CTO技術棧公眾號