你有認(rèn)真了解過(guò)自己的 “Java 對(duì)象”嗎
作為一名 Javaer,生活中的我們可能暫時(shí)沒(méi)有對(duì)象,但是工作中每天都會(huì)創(chuàng)建大量的 Java 對(duì)象,你有試著去了解下自己的“對(duì)象”嗎?
我們從四個(gè)方面重新認(rèn)識(shí)下自己的“對(duì)象”
- 創(chuàng)建對(duì)象的 6 種方式
- 創(chuàng)建一個(gè)對(duì)象在 JVM 中都發(fā)生了什么
- 對(duì)象在 JVM 中的內(nèi)存布局
- 對(duì)象的訪(fǎng)問(wèn)定位
一、創(chuàng)建對(duì)象的方式
- 使用 new 關(guān)鍵字
這是創(chuàng)建一個(gè)對(duì)象最通用、常規(guī)的方法,同時(shí)也是最簡(jiǎn)單的方式。通過(guò)使用此方法,我們可以調(diào)用任何要調(diào)用的構(gòu)造函數(shù)(默認(rèn)使用無(wú)參構(gòu)造函數(shù))
- Person p = new Person();
- 使用 Class 類(lèi)的 newInstance(),只能調(diào)用空參的構(gòu)造器,權(quán)限必須為 public
- //獲取類(lèi)對(duì)象
- Class aClass = Class.forName("priv.starfish.Person");
- Person p1 = (Person) aClass.newInstance();
- Constructor 的 newInstance(xxx),對(duì)構(gòu)造器沒(méi)有要求
- Class aClass = Class.forName("priv.starfish.Person");
- //獲取構(gòu)造器
- Constructor constructor = aClass.getConstructor();
- Person p2 = (Person) constructor.newInstance();
- clone()
深拷貝,需要實(shí)現(xiàn) Cloneable 接口并實(shí)現(xiàn) clone(),不調(diào)用任何的構(gòu)造器
- Person p3 = (Person) p.clone();
- 反序列化
通過(guò)序列化和反序列化技術(shù)從文件或者網(wǎng)絡(luò)中獲取對(duì)象的二進(jìn)制流。
每當(dāng)我們序列化和反序列化對(duì)象時(shí),JVM 會(huì)為我們創(chuàng)建了一個(gè)獨(dú)立的對(duì)象。在 deserialization 中,JVM 不使用任何構(gòu)造函數(shù)來(lái)創(chuàng)建對(duì)象。(序列化的對(duì)象需要實(shí)現(xiàn) Serializable)
- //準(zhǔn)備一個(gè)文件用于存儲(chǔ)該對(duì)象的信息
- File f = new File("person.obj");
- FileOutputStream fos = new FileOutputStream(f);
- ObjectOutputStream oos = new ObjectOutputStream(fos);
- //序列化對(duì)象,寫(xiě)入到磁盤(pán)中
- oos.writeObject(p);
- //反序列化
- FileInputStream fis = new FileInputStream(f);
- ObjectInputStream ois = new ObjectInputStream(fis);
- //反序列化對(duì)象
- Person p4 = (Person) ois.readObject();
- 第三方庫(kù) Objenesls
Java已經(jīng)支持通過(guò) Class.newInstance() 動(dòng)態(tài)實(shí)例化 Java 類(lèi),但是這需要Java類(lèi)有個(gè)適當(dāng)?shù)臉?gòu)造器。很多時(shí)候一個(gè)Java類(lèi)無(wú)法通過(guò)這種途徑創(chuàng)建,例如:構(gòu)造器需要參數(shù)、構(gòu)造器有副作用、構(gòu)造器會(huì)拋出異常。Objenesis 可以繞過(guò)上述限制
二、創(chuàng)建對(duì)象的步驟
這里討論的僅僅是普通 Java 對(duì)象,不包含數(shù)組和 Class 對(duì)象(普通對(duì)象和數(shù)組對(duì)象的創(chuàng)建指令是不同的。創(chuàng)建類(lèi)實(shí)例的指令:new,創(chuàng)建數(shù)組的指令:newarray,anewarray,multianewarray)
1. new指令
虛擬機(jī)遇到一條 new 指令時(shí),首先去檢查這個(gè)指令的參數(shù)是否能在 Metaspace 的常量池中定位到一個(gè)類(lèi)的符號(hào)引用,并且檢查這個(gè)符號(hào)引用代表的類(lèi)是否已被加載、解析和初始化過(guò)(即判斷類(lèi)元信息是否存在)。如果沒(méi)有,那么須在雙親委派模式下,先執(zhí)行相應(yīng)的類(lèi)加載過(guò)程。
2. 分配內(nèi)存
接下來(lái)虛擬機(jī)將為新生代對(duì)象分配內(nèi)存。對(duì)象所需的內(nèi)存的大小在類(lèi)加載完成后便可完全確定。如果實(shí)例成員變量是引用變量,僅分配引用變量空間即可,即 4 個(gè)字節(jié)大小。分配方式有“指針碰撞(Bump the Pointer)”和“空閑列表(Free List)”兩種方式,具體由所采用的垃圾收集器是否帶有壓縮整理功能決定。
- 如果內(nèi)存是規(guī)整的,就采用“指針碰撞”來(lái)為對(duì)象分配內(nèi)存。意思是所有用過(guò)的內(nèi)存在一邊,空閑的內(nèi)存在另一邊,中間放著一個(gè)指針作為分界點(diǎn)的指示器,分配內(nèi)存就僅僅是把指針指向空閑那邊挪動(dòng)一段與對(duì)象大小相等的距離罷了。如果垃圾收集器采用的是 Serial、ParNew 這種基于壓縮算法的,就采用這種方法。(一般使用帶整理功能的垃圾收集器,都采用指針碰撞)

- 如果內(nèi)存是不規(guī)整的,虛擬機(jī)需要維護(hù)一個(gè)列表,這個(gè)列表會(huì)記錄哪些內(nèi)存是可用的,在為對(duì)象分配內(nèi)存的時(shí)候從列表中找到一塊足夠大的空間劃分給該對(duì)象實(shí)例,并更新列表內(nèi)容,這種分配方式就是“空閑列表”。使用CMS 這種基于Mark-Sweep 算法的收集器時(shí),通常采用空閑列表。

我們都知道堆內(nèi)存是線(xiàn)程共享的,那在分配內(nèi)存的時(shí)候就會(huì)存在并發(fā)安全問(wèn)題,JVM 是如何解決的呢?
一般有兩種解決方案:
- 對(duì)分配內(nèi)存空間的動(dòng)作做同步處理,采用 CAS 機(jī)制,配合失敗重試的方式保證更新操作的原子性
- 每個(gè)線(xiàn)程在 Java 堆中預(yù)先分配一小塊內(nèi)存,然后再給對(duì)象分配內(nèi)存的時(shí)候,直接在自己這塊"私有"內(nèi)存中分配,當(dāng)這部分區(qū)域用完之后,再分配新的"私有"內(nèi)存。這種方案稱(chēng)為T(mén)LAB(Thread Local Allocation Buffer),這部分 Buffer 是從堆中劃分出來(lái)的,但是是本地線(xiàn)程獨(dú)享的。
這里值得注意的是,我們說(shuō) TLAB 是線(xiàn)程獨(dú)享的,只是在“分配”這個(gè)動(dòng)作上是線(xiàn)程獨(dú)占的,至于在讀取、垃圾回收等動(dòng)作上都是線(xiàn)程共享的。而且在使用上也沒(méi)有什么區(qū)別。另外,TLAB 僅作用于新生代的 Eden Space,對(duì)象被創(chuàng)建的時(shí)候首先放到這個(gè)區(qū)域,但是新生代分配不了內(nèi)存的大對(duì)象會(huì)直接進(jìn)入老年代。因此在編寫(xiě) Java 程序時(shí),通常多個(gè)小的對(duì)象比大的對(duì)象分配起來(lái)更加高效。
虛擬機(jī)是否使用 TLAB 是可以選擇的,可以通過(guò)設(shè)置 -XX:+/-UseTLAB 參數(shù)來(lái)指定,JDK8 默認(rèn)開(kāi)啟。
3. 初始化
內(nèi)存分配完成后,虛擬機(jī)需要將分配到的內(nèi)存空間都初始化為零值(不包括對(duì)象頭),這一步操作保證了對(duì)象的實(shí)例字段在 Java 代碼中可以不賦初始值就直接使用,程序能訪(fǎng)問(wèn)到這些字段的數(shù)據(jù)類(lèi)型所對(duì)應(yīng)的零值。如:byte、short、long 轉(zhuǎn)化為對(duì)象后初始值為 0,Boolean 初始值為 false。
4. 對(duì)象的初始設(shè)置(設(shè)置對(duì)象的對(duì)象頭)
接下來(lái)虛擬機(jī)要對(duì)對(duì)象進(jìn)行必要的設(shè)置,例如這個(gè)對(duì)象是哪個(gè)類(lèi)的實(shí)例、如何才能找到類(lèi)的元數(shù)據(jù)信息、對(duì)象的哈希碼、對(duì)象的GC分代年齡等信息。這些信息存放在對(duì)象的對(duì)象頭(Object Header)之中。根據(jù)虛擬機(jī)當(dāng)前的運(yùn)行狀態(tài)的不同,如對(duì)否啟用偏向鎖等,對(duì)象頭會(huì)有不同的設(shè)置方式。
5.<init>方法初始化
在上面的工作都完成了之后,從虛擬機(jī)的角度看,一個(gè)新的對(duì)象已經(jīng)產(chǎn)生了,但是從 Java 程序的角度看,對(duì)象創(chuàng)建才剛剛開(kāi)始,
所以,一般來(lái)說(shuō),執(zhí)行 new 指令后接著執(zhí)行 init 方法,把對(duì)象按照程序員的意愿進(jìn)行初始化(應(yīng)該是將構(gòu)造函數(shù)中的參數(shù)賦值給對(duì)象的字段),這樣一個(gè)真正可用的對(duì)象才算完全產(chǎn)生出來(lái)。
三、對(duì)象的內(nèi)存布局
在 HotSpot 虛擬機(jī)中,對(duì)象在內(nèi)存中存儲(chǔ)的布局可以分為 3 塊區(qū)域:對(duì)象頭(Header)、實(shí)例數(shù)據(jù)(Instance Data)、對(duì)其填充(Padding)。
對(duì)象頭
HotSpot 虛擬機(jī)的對(duì)象頭包含兩部分信息。
- 第一部分用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線(xiàn)程持有的鎖、偏向線(xiàn)程ID、偏向時(shí)間戳等。
- 對(duì)象的另一部分類(lèi)型指針,即對(duì)象指向它的類(lèi)元數(shù)據(jù)的指針,虛擬機(jī)通過(guò)這個(gè)指針來(lái)確定這個(gè)對(duì)象是哪個(gè)類(lèi)的實(shí)例(并不是所有的虛擬機(jī)實(shí)現(xiàn)都必須在對(duì)象數(shù)據(jù)上保留類(lèi)型指針,也就是說(shuō),查找對(duì)象的元數(shù)據(jù)信息并不一定要經(jīng)過(guò)對(duì)象本身)。
如果對(duì)象是一個(gè) Java 數(shù)組,那在對(duì)象頭中還必須有一塊用于記錄數(shù)組長(zhǎng)度的數(shù)據(jù)。
元數(shù)據(jù):描述數(shù)據(jù)的數(shù)據(jù)。對(duì)數(shù)據(jù)及信息資源的描述信息。在 Java 中,元數(shù)據(jù)大多表示為注解。
實(shí)例數(shù)據(jù)
實(shí)例數(shù)據(jù)部分是對(duì)象真正存儲(chǔ)的有效信息,也是在程序代碼中定義的各種類(lèi)型的字段內(nèi)容,無(wú)論從父類(lèi)繼承下來(lái)的,還是在子類(lèi)中定義的,都需要記錄起來(lái)。這部分的存儲(chǔ)順序會(huì)受虛擬機(jī)默認(rèn)的分配策略參數(shù)和字段在 Java 源碼中定義的順序影響(相同寬度的字段總是被分配到一起)。
規(guī)則:
- 相同寬度的字段總是被分配在一起
- 父類(lèi)中定義的變量會(huì)出現(xiàn)在子類(lèi)之前
- 如果 CompactFields 參數(shù)為 true(默認(rèn)true),子類(lèi)的窄變量可能插入到父類(lèi)變量的空隙
對(duì)齊填充
對(duì)齊填充部分并不是必然存在的,也沒(méi)有特別的含義,它僅僅起著占位符的作用。由于 HotSpot VM 的自動(dòng)內(nèi)存管理系統(tǒng)要求對(duì)象的起始地址必須是 8 字節(jié)的整數(shù)倍,也就是說(shuō),對(duì)象的大小必須是 8 字節(jié)的整數(shù)倍。而對(duì)象頭部分正好是 8 字節(jié)的倍數(shù)(1倍或者2倍),因此,當(dāng)對(duì)象實(shí)例數(shù)據(jù)部分沒(méi)有對(duì)齊時(shí),就需要通過(guò)對(duì)齊填充來(lái)補(bǔ)全。
我們通過(guò)一個(gè)簡(jiǎn)單的例子加深下理解
- public class PersonObject {
- public static void main(String[] args) {
- Person person = new Person();
- }
- }
- public class Person {
- int id = 1008;
- String name;
- Department department;
- {
- name = "匿名用戶(hù)"; //name賦值為字符串常量
- }
- }
- public class Department {
- int id;
- String name;
- }

四、對(duì)象的訪(fǎng)問(wèn)定位
我們創(chuàng)建對(duì)象的目的,肯定是為了使用它,那 JVM 是如何通過(guò)棧幀中的對(duì)象引用訪(fǎng)問(wèn)到其內(nèi)存的對(duì)象實(shí)例呢?
由于 reference 類(lèi)型在 Java 虛擬機(jī)規(guī)范里只規(guī)定了一個(gè)指向?qū)ο蟮囊?,并沒(méi)有定義這個(gè)引用應(yīng)該通過(guò)哪種方式去定位,以及訪(fǎng)問(wèn)到 Java 堆中的對(duì)象的具體位置,因此不同虛擬機(jī)實(shí)現(xiàn)的對(duì)象訪(fǎng)問(wèn)方式會(huì)有所不同,主流的訪(fǎng)問(wèn)方式有兩種:
- 句柄訪(fǎng)問(wèn)
如果使用句柄訪(fǎng)問(wèn)方式,Java堆中會(huì)劃分出一塊內(nèi)存來(lái)作為句柄池,reference中存儲(chǔ)的就是對(duì)象的句柄地址,而句柄中包含了對(duì)象實(shí)例數(shù)據(jù)和類(lèi)型數(shù)據(jù)各自的具體地址信息。使用句柄方式最大的好處就是reference中存儲(chǔ)的是穩(wěn)定的句柄地址,在對(duì)象被移動(dòng)(垃圾收集時(shí)移動(dòng)對(duì)象是非常普遍的行為)時(shí)只會(huì)改變句柄中的實(shí)例數(shù)據(jù)指針,而reference本身不需要被修改。

- 直接指針(Hotspot 使用該方式)
如果使用該方式,Java堆對(duì)象的布局就必須考慮如何放置訪(fǎng)問(wèn)類(lèi)型數(shù)據(jù)的相關(guān)信息,reference中直接存儲(chǔ)的就是對(duì)象地址。使用直接指針?lè)绞阶畲蟮暮锰幘褪撬俣雀?,他?jié)省了一次指針定位的時(shí)間開(kāi)銷(xiāo)。

參考:
- https://zhuanlan.zhihu.com/p/44948944
- https://blog.csdn.net/boy1397081650/article/details/89930710
- https://www.cnblogs.com/lusaisai/p/12748869.html
- https://juejin.im/post/5d4250def265da03ab422c79






























