Java類加載及對象創(chuàng)建過程詳解
類加載過程
類加載的五個過程:加載、驗證、準(zhǔn)備、解析、初始化。

加載
在加載階段,虛擬機(jī)主要完成三件事:
- 通過一個類的全限定名來獲取定義此類的二進(jìn)制字節(jié)流。
- 將這個字節(jié)流所代表的靜態(tài)存儲結(jié)構(gòu)轉(zhuǎn)化為方法區(qū)域的運行時數(shù)據(jù)結(jié)構(gòu)。
- 在Java堆中生成一個代表這個類的java.lang.Class對象,作為方法區(qū)域數(shù)據(jù)的訪問入口。
驗證
驗證階段作用是保證Class文件的字節(jié)流包含的信息符合JVM規(guī)范,不會給JVM造成危害。如果驗證失敗,就會拋出一個java.lang.VerifyError異常或其子類異常。驗證過程分為四個階段:
- 文件格式驗證:驗證字節(jié)流文件是否符合Class文件格式的規(guī)范,并且能被當(dāng)前虛擬機(jī)正確的處理。
- 元數(shù)據(jù)驗證:是對字節(jié)碼描述的信息進(jìn)行語義分析,以保證其描述的信息符合Java語言的規(guī)范要求
- 字節(jié)碼驗證:主要是進(jìn)行數(shù)據(jù)流和控制流的分析,保證被校驗類的方法在運行時不會危害虛擬機(jī)。
- 符號引用驗證:符號引用驗證發(fā)生在虛擬機(jī)將符號引用轉(zhuǎn)化為直接引用的時候,這個轉(zhuǎn)化動作將在解析階段中發(fā)生。
準(zhǔn)備
準(zhǔn)備階段為變量分配內(nèi)存并設(shè)置類變量的初始化。在這個階段分配的僅為類的變量(static修飾的變量),而不包括類的實例變量。對已非final的變量,JVM會將其設(shè)置成“零值”,而不是其賦值語句的值:pirvate static int size = 12;。那么在這個階段,size的值為0,而不是12。但final修飾的類變量將會賦值成真實的值。
解析
解析過程是將常量池內(nèi)的符號引用替換成直接引用。主要包括四種類型引用的解析。類或接口的解析、字段解析、方法解析、接口方法解析。
初始化
在準(zhǔn)備階段,類變量已經(jīng)經(jīng)過一次初始化了,在這個階段,則是通過程序制定的計劃去初始化類的變量和其他資源。這些資源有static{}塊,構(gòu)造函數(shù),父類的初始化等。
至于使用和卸載階段階段,這里不再過多說明,使用過程就是根據(jù)程序定義的行為執(zhí)行,卸載由GC完成。
雙親委派模型
類加載器按照層次,從頂層到底層,分為以下三種:
- 啟動類加載器(BootstrapClassLoader)
- 這個類加載器負(fù)責(zé)加載%JRE_HOME%\lib下的rt.jar、resources.jar、charsets.jar和class等??梢酝⊿ystem.getProperty("sun.boot.class.path")查看加載的路徑。
- 擴(kuò)展類加載器(ExtensionClassLoader)
- 負(fù)責(zé)加載目錄%JRE_HOME%\lib\ext目錄下的jar包和class文件。也可以通過System.out.println(System.getProperty("java.ext.dirs"))查看加載類文件的路徑。
- 應(yīng)用程序類加載器(ApplicationClassLoader)
- 這個加載器是ClassLoader中g(shù)etSystemClassLoader()方法的返回值,所以一般也稱它為系統(tǒng)類加載器。它負(fù)責(zé)加載用戶類路徑(Classpath)上所指定的類庫,可直接使用這個加載器,如果應(yīng)用程序沒有自定義自己的類加載器,一般情況下這個就是程序中默認(rèn)的類加載。

上圖只是類加載的順序,和類繼承無關(guān)。ExtClassLoader,AppClassLoder繼承URLClassLoader,而URLClassLoader繼承ClassLoader。BoopStrap ClassLoder是由C/C++編寫的,它本身是虛擬機(jī)的一部分,并不是一個java類。
AppClassLoader的父加載器為ExtClassLoader,ExtClassLoader的父加載器為null,BoopStrap ClassLoader為頂級加載器
工作過程
如果一個類加載器收到了類加載的請求,它首先不會自己去嘗試加載這個類,而是把這個請求委派給父類加載器去完成,每一個層次的類加載器都是如此,因此所有的加載請求最終都應(yīng)該傳遞到頂層的啟動類加載器中,只有當(dāng)父類加載器反饋自己無法完成這個請求(它的搜索范圍中沒有找到所需的類)時,子加載器才會嘗試自己去加載。
相對應(yīng)的實現(xiàn)邏輯:先檢查類是否被加載過,若沒有就調(diào)用父加載器的loadClass方法,若父加載器為空則默認(rèn)使用啟動類加載器作為父加載器。如果父加載器加載失敗,拋出異常,再調(diào)用自己的findClass方法進(jìn)行加載。
具體示例:
假如我們自定義Test class文件,jvm要加載Test.class的時候:
- 首先會到自定義加載器中查找,看是否已經(jīng)加載過,如果已經(jīng)加載過,則返回字節(jié)碼。
- 如果自定義加載器沒有加載過,則詢問上一層加載器(即AppClassLoader)是否已經(jīng)加載過Test.class。
- 如果沒有加載過,則詢問上一層加載器(ExtClassLoader)是否已經(jīng)加載過。
- 如果沒有加載過,則繼續(xù)詢問上一層加載(BoopStrap ClassLoader)是否已經(jīng)加載過。
- 如果BoopStrap ClassLoader依然沒有加載過,則到自己指定類加載路徑下("sun.boot.class.path")查看是否有Test.class字節(jié)碼,有則返回,沒有通知下一層加載器ExtClassLoader到自己指定的類加載路徑下(java.ext.dirs)查看。
- 依次類推,最后到自定義類加載器指定的路徑還沒有找到Test.class字節(jié)碼,則拋出異常ClassNotFoundException。
雙親委派的好處
Java類隨著它的類加載器一起具備了一種帶有優(yōu)先級的層次關(guān)系。例如類Object,它放在rt.jar中,無論哪一個類加載器要加載這個類,最終都是委派給啟動類加載器進(jìn)行加載,因此Object類在程序的各種類加載器環(huán)境中都是同一個類。
判斷兩個類是否相同是通過classloader.class這種方式進(jìn)行的,所以哪怕是同一個class文件如果被兩個classloader加載,那么他們也是不同的類。
實現(xiàn)自己的加載器,只需要繼承ClassLoader,并覆蓋findClass方法。
對象創(chuàng)建過程

對象的流程
1. 類加載檢查
JVM遇到一條new指令時,首先檢查這個指令的參數(shù)是否能在常量池中定位到一個類的符號引用,并且檢查這個符號引用代表的類是否已被加載、解析和初始化過。
如果沒有,那必須先執(zhí)行相應(yīng)的類的加載過程。
2. 對象分配內(nèi)存
對象所需內(nèi)存的大小在類加載完成后便完全確定(對象內(nèi)存布局),為對象分配空間的任務(wù)等同于把一塊確定大小的內(nèi)存從Java堆中劃分出來。
根據(jù)Java堆中是否規(guī)整有兩種內(nèi)存的分配方式:(Java堆是否規(guī)整由所采用的垃圾收集器是否帶有壓縮整理功能決定)。
指針碰撞(Bump the pointer)
Java堆中的內(nèi)存是規(guī)整的,所有用過的內(nèi)存都放在一邊,空閑的內(nèi)存放在另一邊,中間放著一個指針作為分界點的指示器,分配內(nèi)存也就是把指針向空閑空間那邊移動一段與內(nèi)存大小相等的距離。例如:Serial、ParNew等收集器。
空閑列表(Free List)
Java堆中的內(nèi)存不是規(guī)整的,已使用的內(nèi)存和空閑的內(nèi)存相互交錯,就沒有辦法簡單的進(jìn)行指針碰撞了。虛擬機(jī)必須維護(hù)一張列表,記錄哪些內(nèi)存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象實例,并更新列表上的記錄。例如:CMS這種基于Mark-Sweep算法的收集器。
3. 并發(fā)處理
對象創(chuàng)建在虛擬機(jī)中時非常頻繁的行為,即使是僅僅修改一個指針指向的位置,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對象A分配內(nèi)存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內(nèi)存的情況。解決這個問題有兩種方案:
同步
虛擬機(jī)采用CAS配上失敗重試的方式保證更新操作的原子性
本地線程分配緩沖(Thread Local Allocation Buffer, TLAB)
把內(nèi)存分配的動作按照線程劃分為在不同的空間之中進(jìn)行,即每個線程在Java堆中預(yù)先分配一小塊內(nèi)存(TLAB)。哪個線程要分配內(nèi)存,就在哪個線程的TLAB上分配。只有TLAB用完并分配新的TLAB時,才需要同步鎖定。
虛擬機(jī)是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來設(shè)定。
4. 內(nèi)存空間初始化
虛擬機(jī)將分配到的內(nèi)存空間都初始化為零值(不包括對象頭),如果使用了TLAB,這一工作過程也可以提前至TLAB分配時進(jìn)行。
內(nèi)存空間初始化保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對應(yīng)的零值。
注意:類的成員變量可以不顯示地初始化(Java虛擬機(jī)都會先自動給它初始化為默認(rèn)值)。方法中的局部變量如果只負(fù)責(zé)接收一個表達(dá)式的值,可以不初始化,但是參與運算和直接輸出等其它情況的局部變量需要初始化。
5. 對象設(shè)置
虛擬機(jī)對對象進(jìn)行必要的設(shè)置,例如這個對象是哪個類的實例、如何才能找到類的元數(shù)據(jù)信息、對象的哈希碼、對象的GC分代年齡等信息。這些信息存放在對象的對象頭之中。
6. 執(zhí)行init()
在上面的工作都完成之后,從虛擬機(jī)的角度看,一個新的對象已經(jīng)產(chǎn)生了。但是從Java程序的角度看,對象的創(chuàng)建才剛剛開始init()方法還沒有執(zhí)行,所有的字段都還是零。
所以,一般來說(由字節(jié)碼中是否跟隨invokespecial指令所決定),執(zhí)行new指令之后會接著執(zhí)行init()方法,把對象按照程序員的意愿進(jìn)行初始化,這樣一個真正可用的對象才算產(chǎn)生出來。
對象的內(nèi)存布局
在HotSpot虛擬機(jī)中。對象在內(nèi)存中存儲的布局分為:
- 對象頭
- 實例數(shù)據(jù)
- 對齊填充
對象頭
HotSpot虛擬機(jī)的對象頭包括兩部分信息:運行時數(shù)據(jù)和類型指針。
- 運行時數(shù)據(jù):用于存儲對象自身的運行時數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID、偏向時間戳等。
- 類型指針:對象指向它的類元數(shù)據(jù)的指針,虛擬機(jī)通過這個指針來確定這個對象是哪個類的實例。

如果對象是一個Java數(shù)組,那在對象頭中還必須有一塊用于記錄數(shù)組長度的數(shù)據(jù),因為虛擬機(jī)可以通過普通Java對象的元數(shù)據(jù)信息確定Java對象的大小,但是從數(shù)組的元數(shù)據(jù)中無法確定數(shù)組的大小。
(并不是所有的虛擬機(jī)實現(xiàn)都必須在對象數(shù)據(jù)上保留類型指針,換句話說,查找對象的元數(shù)據(jù)并不一定要經(jīng)過對象本身,可參考對象的訪問定位)
HotSpot底層通過markOop實現(xiàn)Mark Word,具體實現(xiàn)位于markOop.hpp文件。markOop中提供了大量方法用于查看當(dāng)前對象頭的狀態(tài),以及更新對象頭的數(shù)據(jù),為synchronized鎖的實現(xiàn)提供了基礎(chǔ)。[比如說我們知道synchronized鎖的是對象而不是代碼,而鎖的狀態(tài)保存在對象頭中,進(jìn)而實現(xiàn)鎖住對象]。
有關(guān)synchronized的進(jìn)一步介紹,可以點擊查看:詳解Java多線程鎖之synchronized
實例數(shù)據(jù)
實例數(shù)據(jù)部分是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段內(nèi)容。無論是從父類中繼承下來的,還是在子類中定義的,都需要記錄下來。HotSpot虛擬機(jī)默認(rèn)的分配策略為longs/doubles、ints、shorts/chars、bytes/booleans、oop,從分配策略中可以看出,相同寬度的字段總是分配到一起。
對齊填充
HotSpot虛擬機(jī)要求對象的起始地址必須是8字節(jié)的整數(shù)倍,也就是對象的大小必須是8字節(jié)的整數(shù)倍。而對象頭部分正好是8字節(jié)的倍數(shù)(1倍或者2倍),因此,當(dāng)對象實例數(shù)據(jù)部分沒有對齊的時候,就需要通過對齊填充來補(bǔ)全。
對象的訪問定位
java程序需要通過引用(ref)數(shù)據(jù)來操作堆上面的對象,那么如何通過引用定位、訪問到對象的具體位置。
對象的訪問方式由虛擬機(jī)決定,java虛擬機(jī)提供兩種主流的方式
1.句柄訪問對象
2.直接指針訪問對象。(Sun HotSpot使用這種方式)
句柄訪問
簡單來說就是java堆劃出一塊內(nèi)存作為句柄池,引用中存儲對象的句柄地址,句柄中包含對象實例數(shù)據(jù)、類型數(shù)據(jù)的地址信息。
優(yōu)點:引用中存儲的是穩(wěn)定的句柄地址,在對象被移動【垃圾收集時移動對象是常態(tài)】只需改變句柄中實例數(shù)據(jù)的指針,不需要改動引用【ref】本身。

直接指針
在這種方式中,JVM棧中的棧幀中的本地變量表中所存儲的引用地址就是實例數(shù)據(jù)的地址。通過這個引用就能直接獲取到實例數(shù)據(jù)的地址。
其實引用所指向的對內(nèi)存中的對象數(shù)據(jù)有兩部分組成,一部分就是這個對象實例本身,另一部分是對象類型在方法區(qū)中的地址。
優(yōu)點:優(yōu)勢很明顯,就是速度快,相比于句柄訪問少了一次指針定位的開銷時間。由于對象的訪問在Java中非常頻繁,因此這類開銷積少成多后也是一項非??捎^的執(zhí)行成本。虛擬機(jī)Sun HotSpot而言,它是使用第二種方式進(jìn)行對象訪問的,但從整個軟件開發(fā)的范圍來看,各種語言和框架使用句柄來訪問的情況也十分常見。
