深度剖析Java的Volatile實(shí)現(xiàn)原理,再也不怕面試官問(wèn)了
上篇文章我們講了synchronized的用法和實(shí)現(xiàn)原理,我們總愛說(shuō)synchronized是重量級(jí)鎖,volatile是輕量級(jí)鎖。為什么volatile是輕量級(jí)鎖,體現(xiàn)在哪些方面?以及volatile的作用和實(shí)現(xiàn)原理是怎樣的?本篇帶你一塊學(xué)習(xí)一下。
1. volatile是什么?
volatile是Java提供的一種輕量級(jí)的同步機(jī)制。與synchronized修飾方法、代碼塊不同,volatile只用來(lái)修飾變量。并且與synchronized、ReentrantLock等重量級(jí)鎖不同的是,volatile更輕量級(jí),因?yàn)樗粫?huì)引起線程上下文的切換和調(diào)度。
2. volatile的作用
說(shuō)volatile作用之前,先說(shuō)一下并發(fā)編程的三大特性:原子性、可見性和有序性。
- 原子性
即一個(gè)或者多個(gè)操作作為一個(gè)整體,要么全部執(zhí)行,要么都不執(zhí)行,并且操作在執(zhí)行過(guò)程中不會(huì)被線程調(diào)度機(jī)制打斷;而且這種操作一旦開始,就一直運(yùn)行到結(jié)束,中間不會(huì)有任何上下文切換。
- 可見性
可見性是指當(dāng)多個(gè)線程訪問(wèn)同一個(gè)變量時(shí),一個(gè)線程修改了這個(gè)變量的值,其他線程能夠立即看得到修改的值。
- 有序性
為了提高程序的執(zhí)行效率,編譯器會(huì)對(duì)編譯后的指令進(jìn)行重排序,即代碼的編寫順序不一定就是代碼的執(zhí)行順序。
并發(fā)編程中只有同時(shí)滿足這三大特性,才能保證程序正確的執(zhí)行。而volatile的只保證了可見性和有序性,不保證原子性。
volatile的作用只有兩個(gè):
- 保證內(nèi)存的可見性
- 禁止JVM內(nèi)存重排序(保證有序性)
在并發(fā)多線程情況下,為什么會(huì)有可見性問(wèn)題?如果不做控制,為什么一個(gè)線程修改了共享變量的值,其他線程不能立即看到?這就需要聊到JMM(Java內(nèi)存模型,Java Memory Model)。
3. JMM是什么
JMM(Java內(nèi)存模型,Java Memory Model)定義程序訪問(wèn)變量的規(guī)范,為了屏蔽不同操作系統(tǒng)之間的差異。
由于Java共享變量是存儲(chǔ)在主內(nèi)存中,而Java線程無(wú)法直接訪問(wèn)主內(nèi)存中數(shù)據(jù),只能把主內(nèi)存中的數(shù)據(jù)讀到本地內(nèi)存(相當(dāng)于拷貝一份副本),修改完本地內(nèi)存的數(shù)據(jù),再寫回主內(nèi)存。而此時(shí)另一個(gè)線程也把主內(nèi)存的數(shù)據(jù)拷貝到自己私有的本地內(nèi)存中,雖然線程1已經(jīng)修改了主內(nèi)存從數(shù)據(jù),線程2卻無(wú)法感知到,所以就出現(xiàn)了內(nèi)存可見性問(wèn)題。
4. 可見性問(wèn)題
JMM定義的這套模型,會(huì)有可見性問(wèn)題。當(dāng)線程1修改了本地內(nèi)存的數(shù)據(jù),并刷會(huì)主內(nèi)存中,其他線程中本地內(nèi)存的數(shù)據(jù)并沒有變化。也就是一個(gè)線程修改了共享變量的值,其他線程無(wú)法立即感知到。
像上圖的流程,兩個(gè)線程都把count=0的變量拷貝到自己私有的本地內(nèi)存中,線程1把count的值修改為1,并寫回主內(nèi)存,而線程2本地內(nèi)存的count值還是0。
那么volatile是怎么解決可見性問(wèn)題呢?
volatile主要通過(guò)匯編lock前綴指令,它會(huì)鎖定當(dāng)前內(nèi)存區(qū)域的緩存(緩存行),并且立即將當(dāng)前緩存行數(shù)據(jù)寫入主內(nèi)存(耗時(shí)非常短),回寫主內(nèi)存的時(shí)候會(huì)通過(guò)MESI協(xié)議使其他線程緩存了該變量的地址失效,從而導(dǎo)致其他線程需要重新去主內(nèi)存中重新讀取數(shù)據(jù)到其工作線程中。
什么是MESI協(xié)議?
MESI協(xié)議(Modified Exclusive Shared Or Invalid)是各處理器訪問(wèn)緩存時(shí)都遵循一致性協(xié)議。核心思想是:
當(dāng)CPU寫數(shù)據(jù)時(shí),如果發(fā)現(xiàn)操作的變量是共享變量,即在其他CPU中也存在該變量的副本,會(huì)發(fā)出信號(hào)通知其他CPU將該變量的緩存行置為無(wú)效狀態(tài),因此當(dāng)其他CPU需要讀取這個(gè)變量時(shí),發(fā)現(xiàn)自己緩存中緩存該變量的緩存行是無(wú)效的,那么它就會(huì)從內(nèi)存重新讀取。
MESI分別代表緩存行數(shù)據(jù)所處的四種狀態(tài),通過(guò)對(duì)這四種狀態(tài)的切換,來(lái)達(dá)到對(duì)緩存數(shù)據(jù)進(jìn)行管理的目的。
狀態(tài) | 描述 | 監(jiān)聽任務(wù) |
M 修改(Modify) | 該緩存行有效,數(shù)據(jù)被修改了,和內(nèi)存中的數(shù)據(jù)不一致,數(shù)據(jù)只存在于本緩存行中 | 緩存行必須時(shí)刻監(jiān)聽所有試圖讀該緩存行相對(duì)應(yīng)的內(nèi)存的操作,其他緩存須在本緩存行寫回內(nèi)存并將狀態(tài)置為E之后才能操作該緩存行對(duì)應(yīng)的內(nèi)存數(shù)據(jù) |
E 獨(dú)享、互斥(Exclusive) | 該緩存行有效,數(shù)據(jù)和內(nèi)存中的數(shù)據(jù)一致,數(shù)據(jù)只存在于本緩存行中 | 緩存行必須監(jiān)聽其他緩存讀主內(nèi)存中該緩存行相對(duì)應(yīng)的內(nèi)存的操作,一旦有這種操作,該緩存行需要變成S狀態(tài) |
S 共享(Shared) | 該緩存行有效,數(shù)據(jù)和內(nèi)存中的數(shù)據(jù)一致,數(shù)據(jù)同時(shí)存在于其他緩存中 | 緩存行必須監(jiān)聽其他緩存是該緩存行無(wú)效或者獨(dú)享該緩存行的請(qǐng)求,并將該緩存行置為I狀態(tài) |
I 無(wú)效(Invalid) | 該緩存行數(shù)據(jù)無(wú)效 | 無(wú) |
而MESI協(xié)議是通過(guò)總線嗅探技術(shù)實(shí)現(xiàn)的:
總線嗅探是通過(guò)CPU偵聽總線上發(fā)生的數(shù)據(jù)交換操作,當(dāng)總線上發(fā)生了數(shù)據(jù)操作,那么總線就會(huì)廣播對(duì)應(yīng)的通知,CPU收到通知后,再根據(jù)本地的情況進(jìn)行響應(yīng)。
5. 有序性問(wèn)題
虛擬機(jī)在進(jìn)行代碼編譯時(shí),對(duì)改變順序后不會(huì)對(duì)最終結(jié)果造成影響的代碼,虛擬機(jī)不一定會(huì)按我們寫的代碼順序運(yùn)行,有可能進(jìn)行重排序。實(shí)際上雖然重排后不會(huì)對(duì)變量值有影響,但會(huì)造成線程安全問(wèn)題。
重排序又可以分為三種:
- 編譯器優(yōu)化的重排序。編譯器在不改變單線程程序語(yǔ)義的前提下,可以重新安排語(yǔ)句的執(zhí)行順序
- 指令級(jí)并行的重排序。現(xiàn)代CPU采用了指令級(jí)并行技術(shù)來(lái)將多條指令重疊執(zhí)行。對(duì)于不存在數(shù)據(jù)依賴的指令,CPU可以改變語(yǔ)句對(duì)應(yīng)機(jī)器指令的執(zhí)行順序
- 內(nèi)存系統(tǒng)的重排序。由于CPU使用三級(jí)緩存結(jié)構(gòu),這使得數(shù)據(jù)加載和存儲(chǔ)操作看上去可能是在亂序執(zhí)行的
不過(guò)重排序也不是隨便重排的,發(fā)生指令重排序的前提是:在單線程下不影響執(zhí)行結(jié)果、對(duì)沒有數(shù)值依賴的代碼進(jìn)行重排序。這就是as-if-serial語(yǔ)義。在多線程情況下有一套更具體的規(guī)則,那就是happens-before原則。
happens-before由以下八大原則組成:
- 程序次序規(guī)則:一個(gè)線程內(nèi),按照代碼順序,書寫在前面的操作先行發(fā)生于書寫在后面的操作(線程的執(zhí)行結(jié)果有序)
- 鎖定規(guī)則:一個(gè)unlock操作先行發(fā)生于后面對(duì)同一個(gè)鎖的lock操作
- volatile變量規(guī)則:對(duì)一個(gè)volatile變量的寫操作先行發(fā)生于后面對(duì)這個(gè)變量的讀操作
- 傳遞規(guī)則:如果操作A先行發(fā)生于操作B,操作B先行發(fā)生于操作C,則可以得出操作A先行發(fā)生于操作C
- 線程啟動(dòng)規(guī)則:Thread對(duì)象的start()方法先行發(fā)生于該線程的其他任何操作
- 線程中斷規(guī)則:對(duì)線程中斷方法interrupt()的調(diào)用先行發(fā)生于被中斷線程檢測(cè)到中斷事件的發(fā)生
- 線程終結(jié)規(guī)則:線程中所有操作先行發(fā)生于線程的終止檢測(cè)。通過(guò)Thread.join()方法結(jié)束、Thread.isAlive()方法的返回值等手段檢測(cè)到線程已經(jīng)終止執(zhí)行。比如在A線程中調(diào)用B.join()方法,B線程執(zhí)行完成后,B對(duì)共享變量的修改,對(duì)A來(lái)說(shuō)是可見的
對(duì)象終結(jié)規(guī)則:一個(gè)對(duì)象的初始化方法完成先行發(fā)生于該對(duì)象的finalize()方法的開始
如果兩個(gè)操作不滿足上述八大原則中的任意一個(gè),那么這兩個(gè)操作就沒有順序保證,虛擬機(jī)可以對(duì)這兩個(gè)操作進(jìn)行重排序。如果操作A happens-before 操作B,那么A在內(nèi)存所做的修改對(duì)B都是可見的。
而volatile是通過(guò)插入內(nèi)存屏障(Memory Barrier),在內(nèi)存屏障前后禁止重排序優(yōu)化,以此實(shí)現(xiàn)有序性。
內(nèi)存屏障有兩個(gè)作用:一是保證特定操作的執(zhí)行順序,二是保證某些變量的內(nèi)存可見性。
volatile內(nèi)存語(yǔ)義的實(shí)現(xiàn): JMM 針對(duì)編譯器制定的 volatile 重排序規(guī)則表
操作 | 普通讀寫 | volatile讀 | volatile寫 |
普通讀寫 | 可以重排 | 可以重排 | 不可以重排 |
volatile讀 | 不可以重排 | 不可以重排 | 不可以重排 |
volatile寫 | 可以重排 | 不可以重排 | 不可以重排 |
編譯器在生成字節(jié)碼時(shí),會(huì)在指令序列中插入內(nèi)存屏障來(lái)禁止特定類型的處理器重排序:
- 在每個(gè)volatile寫操作的前面插入一個(gè)StoreStore屏障
- 在每個(gè)volatile寫操作的后面插入一個(gè)StoreLoad屏障
- 在每個(gè)volatile讀操作的后面插入一個(gè)LoadLoad屏障
- 在每個(gè)volatile讀操作的后面插入一個(gè)LoadStore屏障
6. volatile應(yīng)用場(chǎng)景
volatile可以保證可見性和有序性,但無(wú)法保證原子性。所以它的應(yīng)用場(chǎng)景就不如synchronized廣泛,主要有兩個(gè)場(chǎng)景:一是做狀態(tài)變量,二是做需要重新賦值的共享對(duì)象。
比如:第二種場(chǎng)景常見的就有修飾單例模式的對(duì)象。
還有就是CopyOnWriteArrayList的底層實(shí)現(xiàn)就是用volatile修飾的數(shù)組,因?yàn)镃opyOnWriteArrayList每次修改數(shù)據(jù)后都會(huì)數(shù)組重新賦值,而不是只修改數(shù)據(jù)中的一個(gè)值,這樣才能保證了CopyOnWriteArrayList的數(shù)據(jù)安全性。