圖文故事:一文帶你走進JVM的世界
最近的業(yè)余時間基本都在寫一個簡單的RPC框架(附帶詳解以及知識點講解那種,爭取新手都能看懂),所以原創(chuàng)文耽擱了一些,不過也可以讓你們緩沖一下,前今天發(fā)了一些不錯的原創(chuàng)技術(shù)文章。加油!奧利給!❞
小強是一個工作3年有余的開發(fā)工程師,從他的發(fā)量你就可以知道,小強資歷還尚淺。
程序員驚人發(fā)量
最近公司沒什么事,他也開始無聊起來了。這天下午,同事們在激烈的討論這業(yè)務(wù),但他沒有參與,于是他決定學習些什么知識,無聊的翻著各個網(wǎng)頁,發(fā)現(xiàn)JVM是各位大神們推薦過的知識,于是決定好好看一看。
5分鐘過后……
小強感到這知識有些枯燥乏味,怪不得是大神們能看的!又看了幾分鐘,小強倦意襲來,揉了揉睡眼惺忪的眼睛。
然而就在這一刻,他突然發(fā)現(xiàn)周圍同事激烈討論的聲音聽不到了,安靜到了極致。
1. 入界
小強努力的睜開眼睛,才發(fā)現(xiàn)自己竟然身處一個白茫茫的空間中,嚇得一跳,心想我這是怎么了,穿越了?但穿越也得穿越到一個人間如畫,美女如云的地方啊……,這境地……
突然前方走來一個白胡子老頭,小強正想開口,老頭捷足先登:你好,我是這個JVM世界的締造者,你可以叫我 “HotSpot”,不過這無所謂,因為我所創(chuàng)造的這個世界,是按照 “JVM規(guī)范” 來完成的。我正在休息時,發(fā)現(xiàn)來了一位客人,原來是你。
小強:我是想問……
老頭:不用問,我知道,你是想了解一下我創(chuàng)造的這個世界吧!跟我來吧。
這老頭,我還沒說話,這就結(jié)束了!好吧,跟你看看且說。
老頭邊走邊道:JVM 的世界 空間是有限的,我們堅持一個原則 : 各司其職,不留無用之人!
小強:啊!好殘酷。
老頭:不,這不是殘酷,我們這個世界生來就是為客戶提供服務(wù),為客戶發(fā)光發(fā)熱的,每個人奉獻出了自己的能力就是圓滿完成任務(wù),退出舞臺是理所應(yīng)當?shù)?,也是他們最好的歸宿。
小強:也是,這樣這個世界才不會那么擁擠,大家才能井然有序的工作,我怎么這么不開竅呢……
2. 布局
老頭前面停了下來:過來,帶你先看看我們世界的整體組成和中心區(qū)如何布局。
整體布局圖
先來看看我們最主要的日常工作區(qū)(運行時數(shù)據(jù)區(qū)),為了讓我們工作起來更有效率,我們將世界空間劃分為這幾個板塊。
「居住區(qū)-堆」
這里是人們工作外的居住區(qū),居住區(qū)我們基于人們的年齡也進一步分出了,伊甸區(qū),幸存者區(qū),老年區(qū)。
居住區(qū)
「工作區(qū)-?!?/h3>
每個任務(wù)來臨時,都會在工作區(qū)單獨開辟出一個地方來用于完成這個任務(wù)。
棧幀圖
「記錄者-程序計數(shù)器」
由于我們同時能做的任務(wù)有限,所以我們需要為不同的任務(wù)劃分出不同的時間片,我們在切換任務(wù)的時候,需要一個記錄者,能夠記錄我們這個任務(wù)做到了哪里,下次回來能夠繼續(xù)做。
「倉庫管理區(qū)-方法區(qū)」
這里存放著工人的模板以及常用的不變的工具等。
3. 生與死
這里工作的人們都會經(jīng)歷生與死,大部分人們活不到老年,但這不重要,重要的是他為我們做出了貢獻。
3.1 出生
老頭:這里的每個人都有一個模板(類),看到那個正在居住區(qū)休息的高個嗎?他叫張三,他是根據(jù)外部客戶給定的模板 “ User Class” 創(chuàng)造的,他可是客戶最喜愛的工人了。你知道客戶的這些模板(類)是如何進入的到我們的世界中的嗎?
小強:這個我知道點,之前看過一點點。這個過程還是有些復(fù)雜的,客戶的模板(類)是通過一個翻譯工廠(編譯器) 將它翻譯成class 字節(jié)碼,因為你們這個世界只認識字節(jié)碼,然后有你們的加載系統(tǒng)將它們加載到這里。
加載過程中有這些階段:
類加載過程
其中加載階段是由加載器來完成的。
老頭:是的,我們提供了三種加載器,啟動類加載器,擴展類加載器,應(yīng)用類加載器,當然客戶也可以自定義加載器。
雙親委派模型
小強:他們遵循著雙親委派模型,但是我一直不太理解這個詞!
老頭:這是由于你們語言翻譯的問題導(dǎo)致,這個模式叫 “parents delegation”,知道了吧!它是指有你的父輩們來幫你完成。
小強:那雙親委派模式 有什么好處呢?
老頭:
具有優(yōu)先級層次的關(guān)系可以避免模板(類)的重復(fù)加載
安全考慮可以防止Java核心api被替換
老頭繼續(xù)道:那連接過程中的三步,你知道是做什么嗎?
小強:具體的我就不知道了哎……
老頭笑了笑:對于客戶定義的模板(類),我們可不是來者不拒的,為了我們這個世界的安全以及能提供更好的服務(wù),我們會對模板做一些驗證及后續(xù)操作。
驗證包括格式驗證,元數(shù)據(jù)驗證,字節(jié)碼驗證,符號驗證。當驗證通過后,我們會為模板所依賴的東西(類變量)分配空間,最后將符號引用替換為直接引用。
老頭看了看小強眉頭緊皺,于是繼續(xù)補充:你可能不了解什么是符號引用和直接引用!
符號引用就是在編譯時,并不知道模板(類)所依賴的其他東西,會在我們的空間中的哪個位置,只能用符號來表示。
直接引用就是 所有東西被加載到這里后會有自己的真實空間地址,然后去替換符號引用。這樣運行時就能找到它們所依賴的東西了。
最后就是初始化了,這個階段主要是對類變量初始化,是執(zhí)行類構(gòu)造器的過程。
小強:我怎么沒看到這些模板呢?
老頭:這些模板我把他們隱藏在世界的后方,大多數(shù)人是見不到的,他們統(tǒng)稱為 Klass。
小強:不對啊!你是不是搞錯了?不應(yīng)該叫 Class嗎?
老頭:哈哈!我剛才說了,大多數(shù)人見不到,你就是其中之一啊!你們平時見到的 Class只是對 Klass的一種封裝而已,真正記錄模板中的具體元信息的就是 Klass。這回要記住了,年輕人。
3.2 工人
小強:為什么你的工人是等量差的身高呢?
對象長度
老頭:你的觀察還是挺仔細的嘛!是的,他們確實是等量差的,想要知道為什么,要先了解這些工人有哪些部分組成。
對象的組成
它們頭部大小是固定的,身體大小是由自己的屬性數(shù)據(jù)決定的,而最后的腳部卻是我來決定的,如果前面兩個數(shù)據(jù)的大小沒有達到 8 的倍數(shù),那么我就會來填充,所以就是這里的填充使得他們擁有了等量的身高差(內(nèi)存對齊)。
我是基于兩點原因來這個締造他們的:
平臺原因:不是所有的硬件平臺都能訪問任意地址上的任意數(shù)據(jù)的;某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù),否則拋出硬件異常。
性能原因:中央大腦(CPU)訪問內(nèi)存是有內(nèi)存訪問粒度的,就是每次訪問內(nèi)存的長度是固定的,如果不這樣做,那么中央大腦起需要訪問兩次內(nèi)存,而對齊后只需要一次。
小強:嗯,明白了!那能給我說說這些工人在居住區(qū)為什么要不斷的搬遷呢?
3.3 成長
老頭:經(jīng)過長時間的觀察,我發(fā)現(xiàn)每個工人的生命長短是不一樣的。所以我把居住區(qū)分為新生代,老年代,然后讓他們合理的搬遷,這樣能有效的利用空間而且讓垃圾小分隊工作更有效率。
堆區(qū)分代
工人誕生后會分配到Eden區(qū),當Eden區(qū)人員快滿時,垃圾小分隊會來清掃,清掃后如果工人還活著,那么他們將搬遷至Survivor區(qū)中的其中一個,當這個Survivor快滿時,垃圾小分隊會將還活著的工人搬遷至另一個Survivor區(qū)中,就這樣重復(fù)著,每經(jīng)歷一次垃圾小分隊的清掃,活著的工人就會長大一歲,直到工人的年齡達到15歲,到達后會將他們搬遷至老年代生活的地方。但也有例外,如果某個工人吃的太胖,新生代容不下他,那么他將直接去老年代住下。當老年代快住滿時,將會有垃圾大掃除(full gc)。
小強:原來如此啊!從此我再也不是只知道堆區(qū)棧區(qū)的菜鳥啦!哈哈哈哈……
老頭:小伙子,不要高興太早!你到目前為止所了解的仍是九牛一毛。
3.4 死亡證明
小強:如何確定工人是否到達生命的盡頭呢?
第一種:引用計數(shù)法
給每個工人添加一個引用計數(shù)器,就是只要有人需要這個工人幫忙,那么就給這個工人的計數(shù)加1,反之,別人不再需要這個工人的幫忙,那么計數(shù)就減1,直到這個計數(shù)為0,那么表示這個工人生命到了盡頭。
但這種方法有個問題:如果A工人和B工人相互需要幫忙,但沒有任何其他工人或任務(wù)需要他們兩個,那么他們兩個會永遠活下!「所以這種方法我們不會采取的。」
第二種:可達性分析法
我們找出被稱為 “GC roots”的工人作為起點,依次尋找他們工作中依賴的工人,這就可以知道哪些工人是沒有必要在存在下去了。
小強:我怎么知道哪些是 “GC roots”工人呢?
老頭:
工作區(qū)(棧)中的需要用到的工人
倉庫(方法區(qū))中模板(類)本身需要的工人(靜態(tài),常量)
世界后方(native方法)需要的工人
小強:Got it!
4. 回收
老頭:下面我?guī)闳フJ識一下垃圾小分隊的人物吧!不過在認識他們之前你最好了解一下,垃圾清除的基本方法論。
4.1 基本方法論
收集垃圾遵循的基本方法論有以下幾種:
- 標記-清除首先標記出所有需要回收的工人(對象),在標記完成后統(tǒng)一回收所有被標記的工人。但這個有兩個缺點:1. 效率不高 2. 會產(chǎn)生許多碎片空間
- 復(fù)制將可用的空間一分為二,每次只使用其中一塊,當快使用完時,小分隊回收,然后將活著的工人搬遷至另一塊。這雖然解決了標記-清除的效率問題,但此種方法卻縮小了一半空間。
- 標記-整理首先標記出所有需要回收的工人(對象),然后將存活的工人移動到空間的一端,然后清理掉邊界以外的工人。
小強笑了笑:原來是這三種算法啊!我知道!
老頭:既然知道,那跟我來認識一下垃圾清掃隊的人吧!
4.2 主要成員
垃圾清掃隊有好幾個小隊組成,客戶喜歡哪個小隊可以指定讓誰來工作,他們各個隊伍的清掃方式各不相同也各有優(yōu)劣。
我給你介紹一下兩個主要成員吧,CMS,G1兩個小隊出列。
CMS:到,我們是CMS分隊,全稱叫 “Concurrent Mark Sweep”,顧名思義,我們是采用標記清除算法的并發(fā)小分隊,我們以獲取最短回收停頓時間為目標。
小強:那你說說你們是如何工作的?
CMS:我們主要分四個步驟工作,1. 初始標記 2.并發(fā)標記 3.重新標記 4.并發(fā)清除
小強:算啦,這么多步驟太需要時間來了解了,我現(xiàn)在知道你的優(yōu)點了,那你的缺點有什么呢?
CMS:這怎么還帶揭人傷疤的……
老頭這時嚴肅的咳嗽了兩聲,其意CMS立馬捕獲到了,委屈的說:
我有三個缺點:
- 當資源不是很充足時,占用過多的資源,導(dǎo)致任務(wù)變慢
- 無法處理浮動垃圾,我們清理的時候,工人同時也在工作,我們標記后,正好有些工人不在需要了
- 我們分隊遵循的是“標記-清除”算法,所以會產(chǎn)生大量碎片空間,導(dǎo)致世界大掃除(full gc)提前到來
心直口快的小強來了句:原來你的問題這么嚴重,老頭竟然沒把你們小分隊辭掉……
CMS:你…… 想當年我們分隊可是紅極一時的……
那么我猜G1是不是可以彌補CMS的不足呢?
G1: 說實話,我們分隊的目標就是替換CMS分隊…… (JDK14 CMS正式落下帷幕)
小強不懷好意的笑了起來,哈哈……,CMS翻著白眼躲到一旁的角落暗自傷感去了。
CMS角落哭泣
小強:那G1說說你的能耐吧!
G1: 我們隊是基于標記整理算法的,因此不會產(chǎn)生大量碎片空間
- 我們同時引入了分區(qū)的思路,弱化了分代的概念
- 我們的停頓時間是可控的,可避免雪崩現(xiàn)象
- 我們也能充分利用客戶給我們的資源,減少停頓時間
這是我們隊的優(yōu)勢,接下來我給你詳細介紹下我們隊的情況……
小強:好的!你繼續(xù)……
回歸
就在小強聽的興趣濃濃時,天空中突然出現(xiàn)一只巨大無比的手向他襲來,小強躲閃不開,啊……
一只大巴掌
小強捂著自己的頭,有點恍惚,抬頭一看,擦,技術(shù)總監(jiān)……你怎么也在這?
總監(jiān):我不在這我在哪?在家睡大覺嗎!
這時小強才回過神來,原來自己還在辦公室,大事不妙啊!
總監(jiān):小強,回家多爽,明天就不用來了吧!
小強一慌,腦袋靈機一動:總監(jiān),知道我剛才在做什么嗎?那可不是在睡覺,我有一個故事你且聽聽再做決定。
吧啦吧啦……
如果你覺得本文有不巧當之處,請留言告知,如果喜歡本文給個贊鼓勵一下。































