事務(wù)、隔離級別和并發(fā)一致性問題
?數(shù)據(jù)庫的事務(wù)一直以來是數(shù)據(jù)庫最核心的基礎(chǔ)知識,熟悉事務(wù)知識是深入學(xué)習(xí)數(shù)據(jù)庫的前提;同時(shí),數(shù)據(jù)庫的事務(wù)也是互聯(lián)網(wǎng)面試最最最常問的知識之一。
本文我們將從以下幾個(gè)角度深入分析:
- 事務(wù)的四大特性
- 數(shù)據(jù)庫并發(fā)環(huán)境下的一致性問題
- 數(shù)據(jù)庫的隔離級別分別所解決的一致性問題。
話不多說,小伙伴們,上車吧!
事務(wù)
什么是事務(wù)?
事務(wù)是數(shù)據(jù)庫系統(tǒng)里面非常重要的術(shù)語。它可以由一行簡單的SQL來實(shí)現(xiàn),也可以由一組復(fù)雜的SQL來實(shí)現(xiàn)。對于MySQL來說,有兩種事務(wù)實(shí)現(xiàn)方式,一種是顯式事務(wù),另一種則是隱式事務(wù)。顯式事務(wù)需要我們自己手動使用begin或start transaction開啟事務(wù),執(zhí)行完中間的SQL語句后使用commit提交事務(wù),即手動提交。
InnoDB默認(rèn)為隱式事務(wù),即自動提交,每一行insert、update、delete的SQL語句操作都默認(rèn)為一個(gè)獨(dú)立的事務(wù)。如果想關(guān)閉自動提交,可以set autocommit = 0來實(shí)現(xiàn)。
本質(zhì)上來說,事務(wù)其實(shí)就是一系列邏輯操作,為了保證這一系列邏輯操作能夠被準(zhǔn)確、統(tǒng)一、安全地執(zhí)行,就需要通過規(guī)范和技術(shù)來實(shí)現(xiàn)事務(wù),讓事務(wù)具備特性。
事務(wù)有什么特性?
1. 原子性(Atomicity)
一個(gè)事務(wù)被視為不可分割的最小單元,一個(gè)事務(wù)的所有操作要么全部提交成功,要么全部失敗回滾。當(dāng)你為一組行為開啟事務(wù)時(shí),這組行為的全部操作要么同時(shí)成功,要么同時(shí)失敗,不存在某一步行為成功執(zhí)行而另一步執(zhí)行失敗的場景。一旦某個(gè)行為操作失敗,那么這組行為里包括執(zhí)行成功和執(zhí)行失敗的會全部回滾,就像什么事都沒發(fā)生過一樣。
2. 隔離性(Isolation)
一個(gè)事務(wù)所做的修改在最終提交以前,對其它事務(wù)是不可見的。
3. 一致性(Consistency)
數(shù)據(jù)庫的數(shù)據(jù)在事務(wù)執(zhí)行前后都保持一致性狀態(tài)。在一致性狀態(tài)下,所有事務(wù)對同一個(gè)數(shù)據(jù)的讀取結(jié)果都是相同的。不能存在同一個(gè)事務(wù)對某一組數(shù)據(jù)前后兩次讀取的內(nèi)容不一致的場景。
4. 持久性(Durability)
一旦事務(wù)提交,則其所做的修改將會永遠(yuǎn)保存到數(shù)據(jù)庫中。即使系統(tǒng)發(fā)生崩潰,事務(wù)執(zhí)行的結(jié)果也不能丟失。
對于一個(gè)事務(wù),想要實(shí)現(xiàn)它必須遵循以上ACID四個(gè)特性,也就是這四個(gè)特性必須全部得到滿足才可以稱之為一個(gè)完整的數(shù)據(jù)庫“事務(wù)”。
那么InnoDB如何去實(shí)現(xiàn)這四個(gè)特性呢?不同的特性其實(shí)有不同的實(shí)現(xiàn)方式:
并發(fā)一致性問題
什么是數(shù)據(jù)庫的并發(fā)一致性問題?
并發(fā)一致性問題,指的是在并發(fā)環(huán)境下,因?yàn)槭聞?wù)的隔離性很難保證,所以會出現(xiàn)很多并發(fā)問題。
數(shù)據(jù)庫的并發(fā)一致性問題一共有三種,分別是:
1. 臟讀(Dirty Read)
指的是事務(wù)A讀取到了事務(wù)B已經(jīng)修改但是還未提交的數(shù)據(jù)。
假設(shè)A和B同時(shí)讀取一個(gè)數(shù)據(jù),事務(wù)A讀取到這個(gè)數(shù)據(jù)的值為10,隨后將其值修改為20,按道理,事務(wù)A對這個(gè)數(shù)據(jù)的修改在事務(wù)未提交之前是不會被其他事務(wù)看到的,但是由于數(shù)據(jù)庫的隔離性未能保證,此時(shí)事務(wù)B也去讀取這個(gè)數(shù)據(jù)的值,就會直接讀取到事務(wù)A修改完之后的值20,那么此時(shí)如果事務(wù)A進(jìn)行了數(shù)據(jù)的回滾,不提交了。那么事務(wù)B最終讀取到的就是一個(gè)過期的值20。
這種情況就稱為臟讀。
2. 不可重復(fù)讀(Nnrepeatable Read)
指的是在一個(gè)事務(wù)里面兩次讀取到的內(nèi)容不一樣。
事務(wù)B讀取到某個(gè)數(shù)據(jù)S的值為10,隨后事務(wù)A將S的值修改為20。如果B再次讀取這個(gè)數(shù)據(jù),讀取到的值就變?yōu)?0。此時(shí)讀取的結(jié)果和第一次讀取的結(jié)果不同,這就是不可重復(fù)讀。按道理,事務(wù)B都還沒有提交,所讀取到的數(shù)據(jù)應(yīng)該是對別的事務(wù)不可見的,換句話來說應(yīng)該是安全的。但是由于并發(fā)環(huán)境下事務(wù)的隔離型未能滿足,多個(gè)事務(wù)在某一個(gè)相同時(shí)刻對同一個(gè)數(shù)據(jù)進(jìn)行修改,就會出現(xiàn)這樣的并發(fā)沖突問題。
3. 幻讀(Phantom Read)
指的是在一個(gè)事務(wù)內(nèi)查詢某個(gè)數(shù)據(jù)范圍的數(shù)據(jù),如果出現(xiàn)了兩次查詢的結(jié)果不一樣,就稱為“幻讀”。
事務(wù)A根據(jù)條件查詢到某個(gè)范圍的數(shù)據(jù)[10,20,30,40.50],此時(shí)B在這個(gè)符合條件的范圍內(nèi)插入新的數(shù)據(jù),A再次讀取這個(gè)范圍的數(shù)據(jù)后,發(fā)現(xiàn)該范圍多出了一條數(shù)據(jù)60,此時(shí)就發(fā)生了“幻讀”現(xiàn)象?;米x現(xiàn)象發(fā)生的本質(zhì),也是由于事務(wù)的隔離型未能保證導(dǎo)致的。
所以,MySQL如何解決并發(fā)一致性問題?
首先強(qiáng)調(diào)一下,MySQL并不等于InnoDB。
InnoDB是MySQL5.5版本之后默認(rèn)使用的存儲引擎。InnoDB使用MVCC可以解決臟讀和不可重復(fù)讀問題。但是,MVCC并不是唯一可以解決并發(fā)一致性問題的措施。MVCC本質(zhì)上是一種樂觀鎖,通過比較不同事務(wù)的版本號的方式來解決問題??梢允褂脴酚^鎖,那么一樣也可以使用悲觀鎖。MySQL的其他存儲引擎比如Myisam甚至無法使用事務(wù),所以它一般用鎖來解決并發(fā)一致性問題。
在這里,我先不贅述InnoDB的MVCC和MySQL各種各樣的鎖,我們放到之后的文章來講。本篇文章主要強(qiáng)調(diào)事務(wù)本身。
隔離級別
什么是數(shù)據(jù)庫的隔離級別?
指的是實(shí)現(xiàn)了數(shù)據(jù)庫中的安全級別。從對ACID的實(shí)現(xiàn)程度上分為四個(gè)隔離級別。隔離級別越高的數(shù)據(jù)庫越安全,能解決的并發(fā)一致性問題也就越多。
那么數(shù)據(jù)庫有幾種隔離級別呢?
1. 未提交讀(Read Uncommitted)
事務(wù)中的修改,即使沒有提交,對其它事務(wù)也是可見的。該隔離級別會發(fā)生臟讀、不可重復(fù)讀、幻讀。所以是最差的一個(gè)隔離級別。
2. 提交讀(Read Committed)
一個(gè)事務(wù)只能讀取已經(jīng)提交的事務(wù)所做的修改。換句話說,一個(gè)事務(wù)所做的修改在提交之前對其它事務(wù)是不可見的,所以該隔離級別解決了臟讀問題,也就是說,當(dāng)你的數(shù)據(jù)庫實(shí)現(xiàn)到了提交讀這個(gè)隔離級別時(shí),臟讀現(xiàn)象就不會再發(fā)生。
3. 可重復(fù)讀(Repeatable Read)
保證在同一個(gè)事務(wù)中多次讀取同一數(shù)據(jù)的結(jié)果是一樣的。這是第三個(gè)隔離級別,也是InnoDB默認(rèn)實(shí)現(xiàn)的隔離級別。
當(dāng)你的數(shù)據(jù)庫實(shí)現(xiàn)到了提交讀這個(gè)隔離級別時(shí),臟讀和不可重復(fù)讀現(xiàn)象就都不會再發(fā)生。
4. 可串行化(Serializable)
強(qiáng)制事務(wù)串行執(zhí)行,這樣多個(gè)事務(wù)互不干擾,自然而然就不會出現(xiàn)并發(fā)一致性問題。
該隔離級別需要加鎖實(shí)現(xiàn),因?yàn)橐褂眉渔i機(jī)制保證同一時(shí)間只有一個(gè)事務(wù)執(zhí)行。
因?yàn)榭纱谢谴袌?zhí)行,所以不會有并發(fā)問題。這也是最安全的,第四個(gè)隔離級別。
總結(jié)一下:
- 讀未提交就是一種最差的數(shù)據(jù)庫隔離級別, 說明你這個(gè)數(shù)據(jù)庫在多事務(wù)的時(shí)候非常不安全;
- 提交讀能解決臟讀問題;
- 可重復(fù)讀能解決不可重復(fù)讀和臟讀問題;
- 串行化能解決臟讀、不可重復(fù)讀、幻讀問題。
為什么InnoDB不默認(rèn)實(shí)現(xiàn)可串行化?
數(shù)據(jù)庫提出了這四種隔離級別分別來解決不同的并發(fā)一致性問題。
但是,難道隔離級別越高就越好嗎?對于各大編程語言,不僅僅要考慮“安全”,還要考慮“性能”,對于數(shù)據(jù)庫一樣如此。
隔離級別越高,就代表著越安全,但是同時(shí)性能效率也就越低。你想想,當(dāng)你的數(shù)據(jù)庫做到了串行化,就意味沒有并發(fā)問題產(chǎn)生。但是此時(shí)你讀取的數(shù)據(jù)身上掛著一把鎖,一個(gè)數(shù)據(jù)同一時(shí)刻只能被一個(gè)事務(wù)訪問,那么剩下的事務(wù)獲取不到就只能排隊(duì)。實(shí)際生產(chǎn)環(huán)境中往往都是在并發(fā)環(huán)境中對數(shù)據(jù)庫進(jìn)行操作,業(yè)務(wù)高峰的時(shí)候甚至?xí)袔兹f、幾十萬個(gè)事務(wù)同時(shí)存在,所以串行化往往得不到業(yè)務(wù)上的滿足。這就需要在“安全”和“性能”之間做一個(gè)衡量,于是MySQL的InnoDB存儲引擎默認(rèn)實(shí)現(xiàn)的隔離級別為“可重復(fù)讀”,而非可串行化。
總結(jié)
事務(wù)本質(zhì)上就是一系列邏輯操作,不同數(shù)據(jù)庫、不同存儲引擎對事務(wù)的支持強(qiáng)度都是不一樣的。比如Mysql數(shù)據(jù)庫InnoDB引擎天然支持事務(wù),而Myisam引擎則不支持事務(wù)。
數(shù)據(jù)庫事務(wù)只有滿足了ACID四大特性,才能安全的被我們執(zhí)行。如果是在某一個(gè)時(shí)刻只有一個(gè)事務(wù)在操作,那么就不會出現(xiàn)并發(fā)一致性問題,那么ACID就很容易滿足。因?yàn)楦綦x性是可以滿足的,我們只要滿足了原子性,就可以滿足一致性。
但是在多事務(wù)的并發(fā)環(huán)境下,由于事務(wù)的隔離性很難滿足,就會產(chǎn)生臟讀、不可重復(fù)讀、幻讀的并發(fā)一致性問題。為了解決這些并發(fā)一致性問題,數(shù)據(jù)庫系統(tǒng)規(guī)范了四個(gè)隔離級別:未提交讀、提交讀、可重復(fù)讀、可串行化。
隔離級別越高,并發(fā)環(huán)境下數(shù)據(jù)庫越安全,但是性能也越低。所以為了權(quán)衡安全和性能,InnoDB默認(rèn)實(shí)現(xiàn)的隔離級別是“可重復(fù)讀”。
那么如何實(shí)現(xiàn)可重復(fù)讀呢?可以使用鎖,也可以使用MVCC。?