深入理解 Java 內(nèi)存模型(JMM):從原理到實踐
前言
圖片
在Java并發(fā)編程領域,Java內(nèi)存模型(Java Memory Model,JMM)是保障多線程程序正確性的核心基礎。它定義了線程和主內(nèi)存之間的抽象關系,規(guī)范了所有變量的訪問規(guī)則,解決了多線程環(huán)境下因CPU緩存、指令重排序等導致的內(nèi)存可見性、原子性和有序性問題。
什么是 JMM?
JMM并非真實的物理內(nèi)存結(jié)構(gòu),而是Java虛擬機(JVM)為了屏蔽不同硬件和操作系統(tǒng)的內(nèi)存訪問差異,給程序員提供的一套抽象內(nèi)存模型。它規(guī)定:
- 所有變量(包括實例變量、靜態(tài)變量,不包括局部變量和方法參數(shù))都存儲在主內(nèi)存(
Main Memory)中; - 每個線程都有自己的工作內(nèi)存(
Working Memory),線程對變量的所有操作(讀取、賦值等)都必須在工作內(nèi)存中進行,無法直接操作主內(nèi)存; - 線程工作內(nèi)存中的變量是主內(nèi)存變量的副本,線程操作完成后需將結(jié)果同步回主內(nèi)存,其他線程才能感知到變量的更新。
這種主內(nèi)存 - 工作內(nèi)存的抽象模型,本質(zhì)上是對CPU緩存、寄存器等硬件資源的邏輯映射,目的是在程序正確性和硬件性能優(yōu)化之間找到平衡。
JMM 的設計目標
JMM的核心目標有兩個,分別面向開發(fā)者和虛擬機實現(xiàn)者:
- 對開發(fā)者:提供一致的內(nèi)存可見性、原子性和有序性保證,讓開發(fā)者無需關注底層硬件細節(jié),就能編寫出正確的并發(fā)程序;
- 對虛擬機實現(xiàn)者:允許虛擬機根據(jù)不同硬件平臺優(yōu)化指令執(zhí)行(如指令重排序、緩存優(yōu)化),只要不違反
JMM的規(guī)范,即可最大限度利用硬件性能。
內(nèi)存結(jié)構(gòu)劃分
內(nèi)存類型 | 存儲內(nèi)容 | 訪問權(quán)限 |
主內(nèi)存 | 所有線程共享的變量(實例變量、靜態(tài)變量、類信息等) | 線程需通過工作內(nèi)存間接訪問,不能直接操作 |
工作內(nèi)存 | 線程私有的變量副本(主內(nèi)存變量的拷貝)、局部變量、方法參數(shù) | 線程僅能訪問自己的工作內(nèi)存,對變量的操作均在此執(zhí)行 |
需要注意:局部變量和方法參數(shù)存儲在工作內(nèi)存中,且不會被共享,因此不存在并發(fā)安全問題;而實例變量和靜態(tài)變量存儲在主內(nèi)存中,多線程訪問時需遵循 JMM 的交互規(guī)則,否則會出現(xiàn)數(shù)據(jù)不一致。
交互規(guī)則
JMM定義了8種原子操作(Atomic Operation),用于規(guī)范線程工作內(nèi)存與主內(nèi)存之間的變量傳遞,確保操作的完整性和正確性。這 8 種操作必須是原子的、不可拆分的:
lock(鎖定):作用于主內(nèi)存變量,將變量標記為線程獨占狀態(tài);unlock(解鎖):作用于主內(nèi)存變量,釋放被鎖定的變量,允許其他線程鎖定;read(讀?。鹤饔糜谥鲀?nèi)存變量,將變量值從主內(nèi)存?zhèn)鬏數(shù)骄€程工作內(nèi)存,為后續(xù)load操作準備;load(載入):作用于工作內(nèi)存變量,將read操作獲取的主內(nèi)存值存入工作內(nèi)存的變量副本中;use(使用):作用于工作內(nèi)存變量,將工作內(nèi)存中的變量值傳遞給Java虛擬機執(zhí)行引擎(如執(zhí)行方法時使用變量);assign(賦值):作用于工作內(nèi)存變量,將執(zhí)行引擎的計算結(jié)果賦值給工作內(nèi)存中的變量;store(存儲):作用于工作內(nèi)存變量,將工作內(nèi)存中的變量值傳輸?shù)街鲀?nèi)存,為后續(xù)write操作準備;write(寫入):作用于主內(nèi)存變量,將store操作獲取的工作內(nèi)存值存入主內(nèi)存的變量中。
為保證并發(fā)安全,JMM對上述操作附加了3條關鍵約束:
- 禁止
read和load、store和write操作單獨出現(xiàn)(即讀取后必須載入,存儲后必須寫入,確保變量傳遞的完整性); - 禁止線程丟棄
assign操作(即工作內(nèi)存中變量被賦值后,必須同步回主內(nèi)存,不能私吞修改); - 禁止線程無原因地(未執(zhí)行
assign)將工作內(nèi)存變量同步回主內(nèi)存(避免無效更新覆蓋主內(nèi)存值)。
解決的三大核心問題
在多線程環(huán)境下,CPU 緩存、指令重排序會導致內(nèi)存可見性、原子性和有序性問題,JMM通過規(guī)范和機制針對性解決了這三大問題。
內(nèi)存可見性(Visibility)
當一個線程修改了主內(nèi)存中的變量值,其他線程不能立即感知到該修改,導致讀取到過期數(shù)據(jù)。例如:
// 線程A執(zhí)行
boolean flag = false;
public void setFlag() {
flag = true; // 修改主內(nèi)存變量,但未及時同步
}
// 線程B執(zhí)行
public void loop() {
while (!flag) { // 工作內(nèi)存中flag始終為false,陷入死循環(huán)
}
}線程A修改flag后,若未及時通過store-write同步回主內(nèi)存,線程B的工作內(nèi)存中flag副本仍為false,會一直循環(huán)。
JMM 通過volatile關鍵字和鎖(synchronized、Lock)保證可見性:
volatile:當變量被volatile修飾時,線程修改該變量后會立即執(zhí)行store-write同步回主內(nèi)存,同時使其他線程工作內(nèi)存中該變量的副本失效,其他線程讀取時需重新執(zhí)行read-load從主內(nèi)存獲取最新值;- 鎖機制:線程獲取鎖(
lock)時,會清空工作內(nèi)存中共享變量的副本,讀取時從主內(nèi)存重新加載;釋放鎖(unlock)時,會將工作內(nèi)存中修改后的變量同步回主內(nèi)存。
原子性(Atomicity)
原子性指一個操作或多個操作要么全部執(zhí)行,且執(zhí)行過程中不被中斷;要么全部不執(zhí)行。Java中部分操作天然具有原子性(如i = 1),但復合操作(如i++)不具備原子性,會被拆分為讀取 - 賦值 - 寫入三步,導致并發(fā)安全問題:
int i = 0;
// 1000個線程同時執(zhí)行i++
for (int j = 0; j < 1000; j++) {
new Thread(() -> i++).start();
}
// 最終i可能小于1000,因為多個線程同時讀取i=0,執(zhí)行i++后同步回主內(nèi)存,覆蓋彼此結(jié)果JMM 通過以下機制保證原子性:
- 天然原子操作:
JMM規(guī)定read、load、use、assign、store、write等基本操作具有原子性; - 鎖機制:
synchronized和Lock通過獨占鎖保證同一時間只有一個線程執(zhí)行臨界區(qū)代碼,從而確保復合操作的原子性; - 原子類:
Java并發(fā)包(java.util.concurrent.atomic)提供的AtomicInteger、AtomicLong等類,通過CAS(Compare and Swap)操作實現(xiàn)原子性,底層依賴CPU的原子指令(如cmpxchg)。
有序性(Ordering)
有序性指程序執(zhí)行的順序按照代碼的先后順序執(zhí)行。但為了優(yōu)化性能,CPU和JVM會對指令進行重排序(Reordering),重排序分為三種:
- 編譯器重排序:編譯器在不改變單線程語義的前提下,調(diào)整代碼執(zhí)行順序;
CPU指令重排序:CPU為提高執(zhí)行效率,調(diào)整指令的執(zhí)行順序;- 內(nèi)存重排序:由于
CPU緩存的存在,變量的讀寫操作看起來被重排序(如寫后讀可能出現(xiàn)先讀后寫的現(xiàn)象)。
重排序在單線程環(huán)境下不會導致問題,但在多線程環(huán)境下會破壞有序性。例如經(jīng)典的雙重檢查鎖單例問題:
public class Singleton {
private static Singleton instance; // 未加volatile
public static Singleton getInstance() {
if (instance == null) { // 1. 讀取instance
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton(); // 2. 新建對象,可能被重排序
}
}
}
return instance;
}
}instance = new Singleton()會被拆分為三步:
- 分配內(nèi)存;
- 初始化對象;
- 將
instance指向內(nèi)存地址。
編譯器可能重排序為1→3→2,此時線程A執(zhí)行到3后,instance已非null,線程B進入時會直接返回未初始化的instance,導致空指針異常。
JMM 通過volatile 關鍵字、鎖機制和happens-before規(guī)則保證有序性:
volatile:禁止編譯器和CPU對volatile變量的讀寫操作進行重排序(通過內(nèi)存屏障實現(xiàn));- 鎖機制:同一時間只有一個線程執(zhí)行臨界區(qū)代碼,相當于串行化執(zhí)行,天然保證有序性;
happens-before規(guī)則:JMM定義的一套先行發(fā)生規(guī)則,無需任何同步手段,即可保證操作的有序性。例如:
程序次序規(guī)則:單線程中,代碼按書寫順序執(zhí)行(前序操作happens-before后序操作);
監(jiān)視器鎖規(guī)則:解鎖操作happens-before后續(xù)的加鎖操作;
volatile變量規(guī)則:對volatile變量的寫操作happens-before后續(xù)的讀操作;
線程啟動規(guī)則:Thread.start()操作happens-before線程內(nèi)的任意操作;
線程終止規(guī)則:線程內(nèi)的任意操作happens-before線程的終止檢測(如Thread.join())。
JMM 的關鍵實現(xiàn):volatile 關鍵字與鎖機制
volatile 關鍵字的底層原理
volatile是JMM中最常用的輕量級同步手段,主要解決可見性和有序性問題(不保證原子性),其底層通過內(nèi)存屏障實現(xiàn)。
內(nèi)存屏障是一組CPU指令,用于禁止指令重排序,并保證內(nèi)存可見性。JMM對volatile變量的讀寫操作添加了以下內(nèi)存屏障:
- 寫操作后:添加
StoreStore屏障(禁止前面的普通寫操作與當前volatile寫操作重排序)和StoreLoad屏障(禁止當前volatile寫操作與后面的volatile讀 / 寫操作重排序); - 讀操作前:添加
LoadLoad屏障(禁止前面的volatile讀操作與當前volatile讀操作重排序)和LoadStore屏障”(禁止當前volatile讀操作與后面的普通寫操作重排序)。
這些屏障確保:volatile變量的寫操作會立即同步到主內(nèi)存,讀操作會立即從主內(nèi)存加載最新值,且讀寫操作不會與其他操作重排序。
鎖機制與 JMM 的關系
synchronized和java.util.concurrent.locks.Lock是Java中保證原子性、可見性和有序性的 “全能” 同步手段,其與 JMM 的交互遵循以下規(guī)則:
- 原子性:鎖的獨占性確保同一時間只有一個線程執(zhí)行臨界區(qū)代碼,復合操作被拆分為加鎖→執(zhí)行→解鎖三步,整體具有原子性;
- 可見性:線程解鎖時,
JMM會將該線程工作內(nèi)存中所有修改后的變量同步回主內(nèi)存;線程加鎖時,JMM會清空該線程工作內(nèi)存中所有共享變量的副本,強制從主內(nèi)存重新加載; - 有序性:鎖的串行化執(zhí)行特性,確保臨界區(qū)代碼按順序執(zhí)行,且鎖的解鎖
happens-before加鎖規(guī)則,保證不同線程對臨界區(qū)變量的操作具有有序性。



































