Java垃圾回收調(diào)優(yōu)實戰(zhàn)
Java 垃圾回收調(diào)優(yōu)不同于任何其它性能優(yōu)化活動。
首先你要確保自己足夠了解整個應(yīng)用的情況以及調(diào)優(yōu)預(yù)期的結(jié)果,而不是單單滿足于應(yīng)用的某一部分調(diào)優(yōu)。一般情況下,遵循以下過程比較容易:
- 
    
明確自己的性能目標(biāo)。
 - 
    
測試。
 - 
    
測量調(diào)優(yōu)結(jié)果。
 - 
    
與目標(biāo)進行比較。
 - 
    
改變方法并再次測試。
 
性能調(diào)優(yōu)目標(biāo)要是可確定且可測量的,這非常重要。這些目標(biāo)包括延遲、吞吐量和容量,想要了解更多,我推薦看看垃圾回收手冊(Garbage Collection Handbook)中相應(yīng)的章節(jié)。讓我們看看在實踐中如何設(shè)定并達到這樣的調(diào)優(yōu)目標(biāo)。為了這個目的,讓我們來看一個示例代碼:
- //imports skipped for brevity
 - public class Producer implements Runnable {
 - private static ScheduledExecutorService executorService = Executors.newScheduledThreadPool(2);
 - private Deque<byte[]> deque;
 - private int objectSize;
 - private int queueSize;
 - public Producer(int objectSize, int ttl) {
 - this.deque = new ArrayDeque<byte[]>();
 - this.objectSize = objectSize;
 - this.queueSize = ttl * 1000;
 - }
 - @Override
 - public void run() {
 - for (int i = 0; i < 100; i++) {
 - deque.add(new byte[objectSize]);
 - if (deque.size() > queueSize) {
 - deque.poll();
 - }
 - }
 - }
 - public static void main(String[] args) throws InterruptedException {
 - executorService.scheduleAtFixedRate(new Producer(200 * 1024 * 1024 / 1000, 5), 0, 100, TimeUnit.MILLISECONDS);
 - executorService.scheduleAtFixedRate(new Producer(50 * 1024 * 1024 / 1000, 120), 0, 100, TimeUnit.MILLISECONDS);
 - TimeUnit.MINUTES.sleep(10);
 - executorService.shutdownNow();
 - }
 - }
 
代碼中提交了兩個作業(yè)(job),且每 100ms 運行一次。每個作業(yè)模擬特定對象的生命周期:先創(chuàng)建對象,讓它們“存活”一段時間,然后忘記它們,讓 GC 回收內(nèi)存。 運行這個示例時,開啟 GC 日志并使用以下參數(shù):
-XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps
我們立即在日志文件中看到 GC 的影響和下面這些相似:
- 2015-06-04T13:34:16.119-0200: 1.723: [GC (Allocation Failure) [PSYoungGen: 114016K->73191K(234496K)] 421540K->421269K(745984K), 0.0858176 secs] [Times: user=0.04 sys=0.06, real=0.09 secs]
 - 2015-06-04T13:34:16.738-0200: 2.342: [GC (Allocation Failure) [PSYoungGen: 234462K->93677K(254976K)] 582540K->593275K(766464K), 0.2357086 secs] [Times: user=0.11 sys=0.14, real=0.24 secs]
 - 2015-06-04T13:34:16.974-0200: 2.578: [Full GC (Ergonomics) [PSYoungGen: 93677K->70109K(254976K)] [ParOldGen: 499597K->511230K(761856K)] 593275K->581339K(1016832K), [Metaspace: 2936K->2936K(1056768K)], 0.0713174 secs] [Times: user=0.21 sys=0.02, real=0.07 secs]
 
基于日志中的信息,我們可以開始改善性能。并請牢記三個不同的目標(biāo):
- 
    
確保 GC pause(垃圾回收暫停)的最壞情況不要超過預(yù)期的臨界值。
 - 
    
確保應(yīng)用程序線程停滯時間不超過預(yù)先確定的閥值。
 - 
    
降低基礎(chǔ)架構(gòu)成本,同時確保我們?nèi)钥梢詫崿F(xiàn)合理的延遲和吞吐量目標(biāo)。
 
為此,以三個不同的配置各運行了10分鐘,在下表中總結(jié)了三個差距較大的結(jié)果:
| 
             堆  | 
            
             GC算法  | 
            
             有效工作  | 
            
             長暫停  | 
        
|---|---|---|---|
| 
             -Xmx12g  | 
            
             -XX:+UseConcMarkSweepGC  | 
            
             89.8%  | 
            
             560 ms  | 
        
| 
             -Xmx12g  | 
            
             -XX:+UseParallelGC  | 
            
             91.5%  | 
            
             1,104 ms  | 
        
| 
             -Xmx8g  | 
            
             -XX:+UseConcMarkSweepGC  | 
            
             66.3%  | 
            
             1,610 ms  | 
        
實驗中,設(shè)置不同的 GC 算法和不同的堆大小,運行相同的代碼,然后測量垃圾回收暫停的持續(xù)時間和吞吐量。實驗細節(jié)和結(jié)果的解釋都在我們的垃圾回收手冊中。看看手冊中的一些例子,修改一些簡單的配置造成延遲、吞吐量等各方面的性能完全不同。
注意:為了保持示例盡可能簡單,只有數(shù)量有限的輸入?yún)?shù)被改變,例如沒有對不同數(shù)量的核心(CPU core)或不同堆布局進行測試。















 
 
 







 
 
 
 