偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

MySQL 為什么需要兩階段提交?

數(shù)據(jù)庫 MySQL
我們中文一般稱作歸檔日志,如果大家看過松哥之前發(fā)的 MySQL 主從搭建,應該對這個日志有印象,當我們搭建 MySQL 主從的時候就離不開 binlog。

為什么要兩階段提交?一階段提交不行嗎?

小伙伴們知道,MySQL 中的事務是兩階段提交,我們見到的很多分布式事務也都是兩階段提交的,例如 Seata,那么為什么要兩階段提交呢?一次直接提交了不行嗎?今天我們來聊聊這個話題。

1. 什么是兩階段提交

1.1 binlog 與 redologbinlog

binlog

我們中文一般稱作歸檔日志,如果大家看過松哥之前發(fā)的 MySQL 主從搭建,應該對這個日志有印象,當我們搭建 MySQL 主從的時候就離不開 binlog。

binlog 是 MySQL Server 層的日志,而不是存儲引擎自帶的日志,它記錄了所有的 DDL 和 DML(不包含數(shù)據(jù)查詢語句)語句,而且是以事件形式記錄,還包含語句所執(zhí)行的消耗的時間等,需要注意的是:

  • binlog 是一種邏輯日志,他里邊所記錄的是一條 SQL 語句的原始邏輯,例如給某一個字段 +1,注意這個區(qū)別于 redo log 的物理日志(在某個數(shù)據(jù)頁上做了什么修改)。
  • binlog 文件寫滿后,會自動切換到下一個日志文件繼續(xù)寫,而不會覆蓋以前的日志,這個也區(qū)別于 redo log,redo log 是循環(huán)寫入的,即后面寫入的可能會覆蓋前面寫入的。
  • 一般來說,我們在配置 binlog 的時候,可以指定 binlog 文件的有效期,這樣在到期后,日志文件會自動刪除,這樣避免占用較多存儲空間。

根據(jù) MySQL 官方文檔的介紹,開啟 binlog 之后,大概會有 1% 的性能損耗,不過這還是可以接受的,一般來說,binlog 有兩個重要的使用場景:

  • MySQL 主從復制時:在主機上開啟 binlog,主機將 binlog 同步給從機,從機通過 binlog 來同步數(shù)據(jù),進而實現(xiàn)主機和從機的數(shù)據(jù)同步。
  • MySQL 數(shù)據(jù)恢復,通過使用 mysqlbinlog 工具再結合 binlog 文件,可以將數(shù)據(jù)恢復到過去的某一時刻。

redo log

前面我們說的 binlog 是 MySQL 自己提供的,在 MySQL 的 server 層,而 redo log 則不是 MySQL 提供的,是存儲引擎 InnoDB 自己提供的。所以在 MySQL 中就存在兩類日志 binlog 和 redo log,存在兩類日志既有歷史原因(InnoDB 最早不是 MySQL 官方存儲引擎)也有技術原因,這個咱們以后再細聊。

我們都知道,事務的四大特性里面有一個是持久性,即只要事務提交成功,那么對數(shù)據(jù)庫做的修改就被永久保存下來了,寫到磁盤中了,怎么做到的呢?其實我們很容易想到是在每次事務提交的時候,將該事務涉及修改的數(shù)據(jù)頁全部刷新到磁盤中,一旦寫到磁盤中,就不怕數(shù)據(jù)丟失了。

但是要是每次都這么搞,數(shù)據(jù)庫就不知道慢到哪里去了!因為 Innodb 是以頁為單位進行磁盤交互的,而一個事務很可能只修改一個數(shù)據(jù)頁里面的幾個字節(jié),這個時候將完整的數(shù)據(jù)頁刷到磁盤的話,不僅效率低,也浪費資源。效率低是因為這些數(shù)據(jù)頁在物理上并不連續(xù),將數(shù)據(jù)頁刷到磁盤會涉及到隨機 IO。

有鑒于此,MySQL 設計了 redo log,在 redo log 中只記錄事務對數(shù)據(jù)頁做了哪些修改。那有人說,寫 redo log 不就是磁盤 IO 嗎?而寫數(shù)據(jù)到磁盤也是磁盤 IO,既然都是磁盤 IO,那干嘛不把直接把數(shù)據(jù)寫到磁盤呢?還費這事!

此言差矣。

寫 redo log 跟寫數(shù)據(jù)有一個很大的差異,那就是 redo log 是順序 IO,而寫數(shù)據(jù)涉及到隨機 IO,寫數(shù)據(jù)需要尋址,找到對應的位置,然后更新/添加/刪除,而寫 redo log 則是在一個固定的位置循環(huán)寫入,是順序 IO,所以速度要高于寫數(shù)據(jù)。

redo log 本身又分為:

  • 日志緩沖(redo log buffer),該部分日志是易失性的。
  • 重做日志(redo log file),這是磁盤上的日志文件,該部分日志是持久的。

MySQL 每執(zhí)行一條 DML 語句,先將記錄寫入 redo log buffer,后續(xù)在某個時間點再一次性將多個操作記錄寫到 redo log file,這種先寫日志再寫磁盤的技術就是 MySQL 里經(jīng)常說到的 WAL(Write-Ahead Logging) 技術(預寫日志)。

1.2 兩階段提交

在 MySQL 中,兩階段提交的主角就是 binlog 和 redolog,我們來看一個兩階段提交的流程圖:

從上圖中可以看出,在最后提交事務的時候,有 3 個步驟:

  • 寫入 redo log,處于 prepare 狀態(tài)。
  • 寫 binlog。
  • 修改 redo log 狀態(tài)變?yōu)?commit。

由于 redo log 的提交分為 prepare 和 commit 兩個階段,所以稱之為兩階段提交。

2. 為什么需要兩階段提交

如果沒有兩階段提交,那么 binlog 和 redolog 的提交,無非就是兩種形式:

  • 先寫 binlog 再寫 redolog。
  • 先寫 redolog 再寫 binlog。

這兩種情況我們分別來看。

假設我們要向表中插入一條記錄 R,如果是先寫 binlog 再寫 redolog,那么假設 binlog 寫完后崩潰了,此時 redolog 還沒寫。那么重啟恢復的時候就會出問題:binlog 中已經(jīng)有 R 的記錄了,當從機從主機同步數(shù)據(jù)的時候或者我們使用 binlog 恢復數(shù)據(jù)的時候,就會同步到 R 這條記錄;但是 redolog 中沒有關于 R 的記錄,所以崩潰恢復之后,插入 R 記錄的這個事務是無效的,即數(shù)據(jù)庫中沒有該行記錄,這就造成了數(shù)據(jù)不一致。

相反,假設我們要向表中插入一條記錄 R,如果是先寫 redolog 再寫 binlog,那么假設 redolog 寫完后崩潰了,此時 binlog 還沒寫。那么重啟恢復的時候也會出問題:redolog 中已經(jīng)有 R 的記錄了,所以崩潰恢復之后,插入 R 記錄的這個事務是有效的,通過該記錄將數(shù)據(jù)恢復到數(shù)據(jù)庫中;但是 binlog 中還沒有關于 R 的記錄,所以當從機從主機同步數(shù)據(jù)的時候或者我們使用 binlog 恢復數(shù)據(jù)的時候,就不會同步到 R 這條記錄,這就造成了數(shù)據(jù)不一致。

那么按照前面說的兩階段提交就能解決問題嗎?

我們來看如下三種情況:

情況一:一階段提交之后崩潰了,即寫入 redo log,處于 prepare 狀態(tài) 的時候崩潰了,此時:

由于 binlog 還沒寫,redo log 處于 prepare 狀態(tài)還沒提交,所以崩潰恢復的時候,這個事務會回滾,此時 binlog 還沒寫,所以也不會傳到備庫。

情況二:假設寫完 binlog 之后崩潰了,此時:

redolog 中的日志是不完整的,處于 prepare 狀態(tài),還沒有提交,那么恢復的時候,首先檢查 binlog 中的事務是否存在并且完整,如果存在且完整,則直接提交事務,如果不存在或者不完整,則回滾事務。

情況三:假設 redolog 處于 commit 狀態(tài)的時候崩潰了,那么重啟后的處理方案同情況二。

由此可見,兩階段提交能夠確保數(shù)據(jù)的一致性。

責任編輯:武曉燕 來源: 江南一點雨
相關推薦

2024-05-21 14:12:07

2024-12-06 07:10:00

2023-01-18 10:35:49

MySQL數(shù)據(jù)庫

2023-12-05 09:33:08

分布式事務

2023-07-26 09:24:03

分布式事務分布式系統(tǒng)

2017-08-30 18:15:54

MySql

2018-10-29 08:44:29

分布式兩階段提交事務

2023-11-29 07:47:58

DDIA兩階段提交

2025-06-10 08:02:15

2022-12-21 19:04:35

InnoDBMySQL

2025-06-19 08:03:03

2024-01-26 08:18:03

2020-02-03 12:12:28

MySQL數(shù)據(jù)庫SQL

2024-07-22 08:57:58

2025-05-16 07:46:11

分布式事務服務

2021-10-12 19:12:15

單步實現(xiàn)系統(tǒng)

2024-12-23 13:00:00

MySQLMVCC數(shù)據(jù)庫

2011-02-16 09:42:04

DevOps

2024-03-26 16:24:46

分布式事務2PC3PC

2022-07-27 08:52:10

MySQL二階段提交
點贊
收藏

51CTO技術棧公眾號