垃圾收集器的秘密:深入理解JVM性能調(diào)優(yōu)
原創(chuàng)作者 | 波哥
審校 | 重樓
Java虛擬機(JVM)的自動內(nèi)存管理是Java開發(fā)者的福音,它通過垃圾收集(GC)機制自動回收不再使用的對象,極大地簡化了內(nèi)存管理。然而,不恰當?shù)腉C配置或不理想的垃圾收集器選擇可能會對應用性能產(chǎn)生負面影響。為了優(yōu)化Java應用的性能,深入理解GC的原理和策略是至關(guān)重要的。本文筆者將詳細探討JVM的垃圾收集機制,包括內(nèi)存模型、GC算法、各種垃圾收集器的特點及其調(diào)優(yōu)策略。

一、JVM內(nèi)存模型深入解析
JVM的內(nèi)存模型是理解GC機制的基礎。JVM將內(nèi)存分為多個區(qū)域,主要包括堆(Heap)、方法區(qū)(Method Area)、程序計數(shù)器(Program Counter Register)、虛擬機棧(VM Stack)和本地方法棧(Native Method Stack)。
1.堆(Heap)
堆內(nèi)存是Java虛擬機(JVM)管理的最大一塊內(nèi)存區(qū)域,它被所有線程共享,主要用于存放對象實例和數(shù)組。從垃圾收集的角度,堆內(nèi)存進一步細分為新生代(Young Generation)、老年代(Old Generation)以及元空間(Metaspace,在Java 8之后取代了永久代PermGen)。
(1)新生代(Young Generation)
新生代是大多數(shù)新創(chuàng)建的對象的誕生地。由于對象的生存周期大多數(shù)較短,新生代的垃圾收集(Minor GC)發(fā)生頻繁但速度快。新生代進一步分為三個區(qū)域:
- Eden區(qū):幾乎所有新生成的對象首先都是在Eden區(qū)分配。
 - 兩個Survivor區(qū)(S0和S1):用于存放從Eden區(qū)和Survivor區(qū)經(jīng)過一次Minor GC后仍然存活的對象。在每次Minor GC后,存活的對象會被移動到一個Survivor區(qū),而另一個空閑的Survivor區(qū)將用于下一輪的存活對象移動。
 
(2)老年代(Old Generation)
隨著時間的推移,一些在新生代中經(jīng)歷了多次GC依然存活的對象會被移動到老年代。老年代用于存放應用中生命周期長的對象。相較于新生代,老年代的空間更大,GC發(fā)生的頻率更低,但每次GC的時間更長。
對象進入老年代(Old Generation)通常是基于它們的存活周期。JVM采用分代垃圾收集策略,其中對象首先在新生代(Young Generation)分配。隨著垃圾收集的進行,只有存活下來的對象才會逐步晉升到老年代。具體而言,有幾種情況下對象會進入到老年代:
(3)經(jīng)歷多次Minor GC后仍然存活的對象
新生代中的對象在經(jīng)歷了一定數(shù)量的Minor GC(垃圾收集只針對新生代的收集稱為Minor GC)后,如果仍然存活,它們會被移動到老年代。JVM中有一個年齡計數(shù)器,每當對象在Minor GC后仍然存活,它的年齡就會增加。當對象的年齡增加到一定閾值(默認為15,但可以通過JVM參數(shù)-XX:MaxTenuringThreshold進行調(diào)整)時,這個對象就會被晉升到老年代。
 
(4)大對象直接分配到老年代
所謂的大對象是指需要大量連續(xù)內(nèi)存空間的Java對象,例如那些很大的數(shù)組和長字符串。如果新生代中的Eden區(qū)無法容納一個新創(chuàng)建的對象,JVM就會直接將這個對象分配到老年代。這樣做是為了避免在新生代中為大對象分配內(nèi)存后,進行Minor GC時發(fā)生大量的內(nèi)存復制操作(因為新生代使用的是復制算法)。通過JVM參數(shù)-XX:PretenureSizeThreshold可以設置大對象的大小閾值。
 
(5)動態(tài)年齡判斷
在新生代的兩個Survivor區(qū)之間,對象每經(jīng)過一次Minor GC就會年齡增加。如果在Survivor空間中相同年齡所有對象的大小的總和大于Survivor空間的一半,年齡大于或等于該年齡的對象就可以直接進入老年代,無需等到-XX:MaxTenuringThreshold設置的年齡。
 
(6)空間分配擔保
在進行Minor GC前,虛擬機會檢查老年代最大可用的連續(xù)空間是否大于新生代所有對象的總空間。如果這個條件不能滿足,虛擬機會提前將新生代中的部分對象轉(zhuǎn)移到老年代中,這個過程稱為“空間分配擔?!?。目的是確保Minor GC可以順利完成,不會因為老年代空間不足而觸發(fā)更耗時的Full GC。
 
(7)元空間(Metaspace)
元空間用于存放類的元數(shù)據(jù)信息,如類的定義信息、常量、靜態(tài)變量等,并使用本地內(nèi)存(而非JVM堆內(nèi)存)。在Java 8之前,這部分數(shù)據(jù)被存放在永久代中。元空間的引入是為了避免永久代容易發(fā)生的內(nèi)存溢出問題,并提供更靈活的內(nèi)存管理。
2.方法區(qū)(Method Area)
方法區(qū)(Method Area)是堆的一部分,也被稱為非堆(Non-Heap),它被所有線程共享。方法區(qū)主要用于存放已被虛擬機加載的類信息、常量、靜態(tài)變量、即時編譯器編譯后的代碼等數(shù)據(jù)。
在Java 8及之后的版本中,傳統(tǒng)的永久代(PermGen)被元空間(Metaspace)所取代。與永久代不同,元空間并不在虛擬機內(nèi)存中,而是使用本地內(nèi)存,因此,元空間的大小只受本地內(nèi)存限制。
方法區(qū)的特點
- 靜態(tài)存儲:方法區(qū)存儲的信息相對靜態(tài),包括類的結(jié)構(gòu)(如運行時常量池、字段和方法數(shù)據(jù))以及方法和構(gòu)造函數(shù)的代碼。
 - 全局共享:方法區(qū)被所有線程共享,這意味著它不像堆那樣頻繁地進行垃圾收集。實際上,方法區(qū)的垃圾收集主要針對常量池的回收和對類型的卸載。
 - 動態(tài)擴展:雖然方法區(qū)的初始大小有限,但它可以在運行時動態(tài)擴展,也可以設置最大空間大小,以防止其過度消耗內(nèi)存。
 
方法區(qū)的垃圾收集
方法區(qū)的垃圾收集比較少見且難以執(zhí)行,主要涉及兩部分工作:廢棄常量的回收和無用類的卸載。無用類的卸載條件相對嚴格,需要同時滿足以下三個條件:
- 該類所有的實例都已經(jīng)被回收,也就是說Java堆中不存在該類的任何實例。
 - 加載該類的ClassLoader已經(jīng)被回收。
 - 該類對應的java.lang.Class對象沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。
 
二、GC算法的探究
GC算法是實現(xiàn)垃圾收集的具體方法。主要的GC算法包括標記-清除(Mark-Sweep)、復制(Copying)和標記-整理(Mark-Compact),下面筆者將詳細介紹這三種算法的工作原理以及它們的優(yōu)缺點。
1.標記-清除算法
(1)工作原理
- 標記階段:從一組根對象(通常是活躍線程的局部變量和輸入?yún)?shù)、靜態(tài)字段等)開始遍歷,標記所有從這些根對象可達的對象。
 - 清除階段:掃描整個堆空間,回收所有未被標記的對象所占用的內(nèi)存。
 
(2)優(yōu)點
- 簡單直接,實現(xiàn)相對容易。
 - 不需要額外移動對象,減少了額外的開銷。
 
(3)缺點
- 執(zhí)行過程中會產(chǎn)生內(nèi)存碎片,導致后續(xù)可能無法為大對象分配連續(xù)內(nèi)存空間。
 - 需要暫停應用程序執(zhí)行(Stop-The-World),可能會導致應用響應時間變長。
 
2.復制算法
(1)工作原理
- 將可用內(nèi)存劃分為大小相等的兩塊,每次只使用其中一塊。
 - 當這一塊的內(nèi)存快用完時,將存活的對象復制到另一塊空閑區(qū)域。
 - 清空已使用的內(nèi)存塊,交換兩個內(nèi)存區(qū)域的角色。
 
(2)優(yōu)點
- 解決了標記-清除算法中的內(nèi)存碎片問題。
適合存活對象較少的場景,如新生代的垃圾收集。 
(3)缺點
- 需要將存活的對象復制到另一塊內(nèi)存區(qū)域,增加了復制成本,特別是當存活對象較多時。
內(nèi)存使用效率低,因為任何時候只有一半的內(nèi)存區(qū)域被使用。 
3.標記-整理算法
(1)工作原理
- 標記階段:與標記-清除算法相同,從根集合出發(fā)標記所有可達的對象。
 - 整理階段:將所有存活的對象壓縮到堆的一端,然后清理掉邊界以外的內(nèi)存。
 
(2)優(yōu)點
- 解決了內(nèi)存碎片問題,為大對象的分配提供了連續(xù)的內(nèi)存空間。
 - 避免了復制算法中的高成本復制操作,更適合老年代的垃圾收集。
 
(3)缺點
- 需要移動對象,并更新對象引用的位置,增加了額外的開銷。
 - 同樣需要暫停應用程序執(zhí)行,可能會影響應用的響應時間。
 
現(xiàn)代JVM實現(xiàn)通常采用以上基本GC算法的變體或組合,以達到更高的垃圾收集效率和更低的停頓時間。例如:G1收集器就是將堆劃分為多個區(qū)域(Region),并根據(jù)每個區(qū)域的垃圾回收價值進行增量收集,旨在平衡吞吐量和停頓時間。ZGC和Shenandoah收集器則采用了基于Region的復制算法,實現(xiàn)了幾乎全程并發(fā)的垃圾收集,極大地減少了停頓時間。
JVM提供了多種垃圾收集器,下面我們大概介紹下目前主流的幾種垃圾回收器及每種收集器的適用場景。
- Serial收集器Serial收集器是最簡單的GC實現(xiàn),它使用單線程進行垃圾收集。在進行GC時,需要暫停其他所有工作線程("Stop The World"),因此不適合多處理器環(huán)境或要求低延遲的應用。
 - Parallel(并行)收集器Parallel收集器類似于Serial收集器,但它使用多線程進行垃圾收集,可以顯著減少GC的停頓時間。它主要關(guān)注達到一個可接受的吞吐量(應用時間與GC時間的比率)。
 - Concurrent Mark Sweep(CMS)收集器CMS收集器的目標是盡可能減少應用停頓時間。它通過并發(fā)標記和并發(fā)清除實現(xiàn)了這一點,但是CMS收集器可能會產(chǎn)生較多的內(nèi)存碎片。
 - G1收集器G1收集器是一種服務器端的垃圾收集器,旨在替代CMS收集器,它通過將堆劃分為多個區(qū)域(Region)并并行處理這些區(qū)域來減少停頓時間,同時提供了更細粒度的GC控制。
 - ZGC和Shenandoah收集器ZGC和Shenandoah是實驗性的低延遲垃圾收集器,旨在實現(xiàn)幾乎不停頓的垃圾收集。它們通過使用讀寫屏障和并發(fā)線程來實現(xiàn)這一目標,適用于需要極低停頓時間的應用。
 
三、垃圾收集器的調(diào)優(yōu)實踐
以上我們詳細介紹了垃圾回收算法和主流的垃圾回收器,接下來我們詳細介紹下在實際應用中,該如何根據(jù)具體應用特性進行調(diào)優(yōu)。以下是一些調(diào)優(yōu)的通用策略:
- 選擇合適的垃圾收集器根據(jù)應用的需求(如響應時間要求、吞吐量要求等)和資源限制(如CPU、內(nèi)存大小等),選擇最適合的垃圾收集器。
 - 堆大小調(diào)整適當?shù)卣{(diào)整堆大小可以平衡GC的頻率和停頓時間。一般而言,增大堆大小會減少GC的頻率,但可能增加GC的停頓時間。
 - 監(jiān)控和分析GC日志通過開啟GC日志,可以獲得垃圾收集的詳細信息,如各階段的耗時、回收量等。分析這些數(shù)據(jù)可以幫助識別性能瓶頸和調(diào)優(yōu)方向。
 - 細化GC參數(shù)設置
 
JVM提供了豐富的GC相關(guān)參數(shù),通過調(diào)整這些參數(shù)(如新生代與老年代的比例、觸發(fā)Full GC的閾值等),可以微調(diào)垃圾收集的行為,優(yōu)化性能。
深入理解JVM的垃圾收集機制和各種垃圾收集器的特點是進行有效性能調(diào)優(yōu)的前提。通過選擇合適的垃圾收集器并適當調(diào)優(yōu),可以顯著提升Java應用的性能,滿足不同場景下對響應時間和吞吐量的需求。記住,沒有一勞永逸的解決方案,性能優(yōu)化是一個持續(xù)的過程,需要不斷地監(jiān)控、評估和調(diào)整。
作者介紹
波哥,互聯(lián)行業(yè)從業(yè)10余年,先后擔任項目總監(jiān)及架構(gòu)師。目前專攻技術(shù),喜歡研究技術(shù)原理。技術(shù)全面,主攻Java,精通JVM底層機制及Spring全家桶底層框架原理,熟練掌握當前主流的中間件、服務網(wǎng)格等技術(shù)原理。















 
 
 










 
 
 
 