深入理解多線程(二)—— Java的對(duì)象模型
上一篇文章中簡(jiǎn)單介紹過synchronized關(guān)鍵字的方式,其中,同步代碼塊使用monitorenter和monitorexit兩個(gè)指令實(shí)現(xiàn),同步方法使用ACC_SYNCHRONIZED標(biāo)記符實(shí)現(xiàn)。后面幾篇文章會(huì)從JVM源碼的角度更加深入,層層剝開synchronized的面紗。
在進(jìn)入正題之前,肯定有些基礎(chǔ)知識(shí)需要鋪墊,那么先來看一下一個(gè)容易被忽略的但是又很重要的知識(shí)點(diǎn) —— Java對(duì)象模型 。
大家都知道的是,Java對(duì)象保存在堆內(nèi)存中。在內(nèi)存中,一個(gè)Java對(duì)象包含三部分:對(duì)象頭、實(shí)例數(shù)據(jù)和對(duì)齊填充。其中對(duì)象頭是一個(gè)很關(guān)鍵的部分,因?yàn)閷?duì)象頭中包含鎖狀態(tài)標(biāo)志、線程持有的鎖等標(biāo)志。這篇文章就主要從Java對(duì)象模型入手,找一找我們關(guān)系的對(duì)象頭以及對(duì)象頭中和鎖相關(guān)的運(yùn)行時(shí)數(shù)據(jù)在JVM中是如何表示的。
Java的對(duì)象模型
任何一個(gè)接觸過Java的人都知道,Java是一種面向?qū)ο笳Z(yǔ)言。在學(xué)習(xí)Java的過程中你一定對(duì)下面兩句話不陌生:
1、在面向?qū)ο蟮能浖?,?duì)象(Object)是某一個(gè)類(Class)的實(shí)例。
2、一切皆對(duì)象
我們還知道,在JVM的內(nèi)存結(jié)構(gòu)中,對(duì)象保存在堆內(nèi)存中,而我們?cè)趯?duì)對(duì)象進(jìn)行操作時(shí),其實(shí)操作的是對(duì)象的引用。那么對(duì)象本身在JVM中的結(jié)構(gòu)是什么樣的呢?本文的所有分析均基于HotSpot虛擬機(jī)。
oop-klass model
HotSpot是基于c++實(shí)現(xiàn),而c++是一門面向?qū)ο蟮恼Z(yǔ)言,本身是具備面向?qū)ο蠡咎卣鞯模訨ava中的對(duì)象表示,最簡(jiǎn)單的做法是為每個(gè)Java類生成一個(gè)c++類與之對(duì)應(yīng)。但HotSpot JVM并沒有這么做,而是設(shè)計(jì)了一個(gè)OOP-Klass Model。OOP(Ordinary Object Pointer)指的是普通對(duì)象指針,而Klass用來描述對(duì)象實(shí)例的具體類型。
為什么HotSpot要設(shè)計(jì)一套o(hù)op-klass model呢?答案是:HotSopt JVM的設(shè)計(jì)者不想讓每個(gè)對(duì)象中都含有一個(gè)vtable(虛函數(shù)表)
這個(gè)解釋似乎可以說得通。眾所周知,C++和Java都是面向?qū)ο蟮恼Z(yǔ)言,面向?qū)ο笳Z(yǔ)言有一個(gè)很重要的特性就是多態(tài)。關(guān)于多態(tài)的實(shí)現(xiàn),C++和Java有著本質(zhì)的區(qū)別。
- 多態(tài)是面向?qū)ο蟮淖钪饕奶匦灾唬且环N方法的動(dòng)態(tài)綁定,實(shí)現(xiàn)運(yùn)行時(shí)的類型決定對(duì)象的行為。多態(tài)的表現(xiàn)形式是父類指針或引用指向子類對(duì)象,在這個(gè)指針上調(diào)用的方法使用子類的實(shí)現(xiàn)版本。多態(tài)是IOC、模板模式實(shí)現(xiàn)的關(guān)鍵。
在C++中通過虛函數(shù)表的方式實(shí)現(xiàn)多態(tài),每個(gè)包含虛函數(shù)的類都具有一個(gè)虛函數(shù)表(virtual table),在這個(gè)類對(duì)象的地址空間的最靠前的位置存有指向虛函數(shù)表的指針。在虛函數(shù)表中,按照聲明順序依次排列所有的虛函數(shù)。由于C++在運(yùn)行時(shí)并不維護(hù)類型信息,所以在編譯時(shí)直接在子類的虛函數(shù)表中將被子類重寫的方法替換掉。
在Java中,在運(yùn)行時(shí)會(huì)維持類型信息以及類的繼承體系。每一個(gè)類會(huì)在方法區(qū)中對(duì)應(yīng)一個(gè)數(shù)據(jù)結(jié)構(gòu)用于存放類的信息,可以通過Class對(duì)象訪問這個(gè)數(shù)據(jù)結(jié)構(gòu)。其中,類型信息具有superclass屬性指示了其超類,以及這個(gè)類對(duì)應(yīng)的方法表(其中只包含這個(gè)類定義的方法,不包括從超類繼承來的)。而每一個(gè)在堆上創(chuàng)建的對(duì)象,都具有一個(gè)指向方法區(qū)類型信息數(shù)據(jù)結(jié)構(gòu)的指針,通過這個(gè)指針可以確定對(duì)象的類型。
上面這段是我從網(wǎng)上摘取過來的,說的有一定道理,但是也不全對(duì)。至于為啥,我會(huì)在后文介紹到Klass的時(shí)候細(xì)說。
關(guān)于opp-klass模型的整體定義,在HotSpot的源碼中可以找到。
oops模塊可以分成兩個(gè)相對(duì)獨(dú)立的部分:OOP框架和Klass框架。
在oopsHierarchy.hpp里定義了oop和klass各自的體系。
oop
oop體系:
- //定義了oops共同基類
- typedef class oopDesc* oop;
- //表示一個(gè)Java類型實(shí)例
- typedef class instanceOopDesc* instanceOop;
- //表示一個(gè)Java方法
- typedef class methodOopDesc* methodOop;
- //表示一個(gè)Java方法中的不變信息
- typedef class constMethodOopDesc* constMethodOop;
- //記錄性能信息的數(shù)據(jù)結(jié)構(gòu)
- typedef class methodDataOopDesc* methodDataOop;
- //定義了數(shù)組OOPS的抽象基類
- typedef class arrayOopDesc* arrayOop;
- //表示持有一個(gè)OOPS數(shù)組
- typedef class objArrayOopDesc* objArrayOop;
- //表示容納基本類型的數(shù)組
- typedef class typeArrayOopDesc* typeArrayOop;
- //表示在Class文件中描述的常量池
- typedef class constantPoolOopDesc* constantPoolOop;
- //常量池告訴緩存
- typedef class constantPoolCacheOopDesc* constantPoolCacheOop;
- //描述一個(gè)與Java類對(duì)等的C++類
- typedef class klassOopDesc* klassOop;
- //表示對(duì)象頭
- typedef class markOopDesc* markOop;
上面列出的是整個(gè)Oops模塊的組成結(jié)構(gòu),其中包含多個(gè)子模塊。每一個(gè)子模塊對(duì)應(yīng)一個(gè)類型,每一個(gè)類型的OOP都代表一個(gè)在JVM內(nèi)部使用的特定對(duì)象的類型。
從上面的代碼中可以看到,有一個(gè)變量opp的類型是oppDesc ,OOPS類的共同基類型為oopDesc。
- class oopDesc {
- friend class VMStructs;
- private:
- volatile markOop _mark;
- union _metadata {
- wideKlassOop _klass;
- narrowOop _compressed_klass;
- } _metadata;
- }
在Java程序運(yùn)行過程中,每創(chuàng)建一個(gè)新的對(duì)象,在JVM內(nèi)部就會(huì)相應(yīng)地創(chuàng)建一個(gè)對(duì)應(yīng)類型的OOP對(duì)象。在HotSpot中,根據(jù)JVM內(nèi)部使用的對(duì)象業(yè)務(wù)類型,具有多種oopDesc的子類。除了oppDesc類型外,opp體系中還有很多instanceOopDesc、arrayOopDesc 等類型的實(shí)例,他們都是oopDesc的子類。
這些OOPS在JVM內(nèi)部有著不同的用途,例如,instanceOopDesc表示類實(shí)例,arrayOopDesc表示數(shù)組。也就是說,當(dāng)我們使用new創(chuàng)建一個(gè)Java對(duì)象實(shí)例的時(shí)候,JVM會(huì)創(chuàng)建一個(gè)instanceOopDesc對(duì)象來表示這個(gè)Java對(duì)象。同理,當(dāng)我們使用new創(chuàng)建一個(gè)Java數(shù)組實(shí)例的時(shí)候,JVM會(huì)創(chuàng)建一個(gè)arrayOopDesc對(duì)象來表示這個(gè)數(shù)組對(duì)象。
在HotSpot中,oopDesc類定義在oop.hpp中,instanceOopDesc定義在instanceOop.hpp中,arrayOopDesc定義在arrayOop.hpp中。
簡(jiǎn)單看一下相關(guān)定義:
- class instanceOopDesc : public oopDesc {
- }
- class arrayOopDesc : public oopDesc {
- }
通過上面的源碼可以看到,instanceOopDesc實(shí)際上就是繼承了oopDesc,并沒有增加其他的數(shù)據(jù)結(jié)構(gòu),也就是說instanceOopDesc中包含兩部分?jǐn)?shù)據(jù):markOop _mark和union _metadata。
這里的markOop你可能又熟悉了,這不就是OOPS體系中的一部分嗎,上面注釋中已經(jīng)說過,他表示對(duì)象頭。 _metadata是一個(gè)聯(lián)合體,這個(gè)字段被稱為元數(shù)據(jù)指針。指向描述類型Klass對(duì)象的指針。
HotSpot虛擬機(jī)中,對(duì)象在內(nèi)存中存儲(chǔ)的布局可以分為三塊區(qū)域:對(duì)象頭、實(shí)例數(shù)據(jù)和對(duì)齊填充。在虛擬機(jī)內(nèi)部,一個(gè)Java對(duì)象對(duì)應(yīng)一個(gè)instanceOopDesc的對(duì)象,該對(duì)象中有兩個(gè)字段分別表示了對(duì)象頭和實(shí)例數(shù)據(jù)。那就是_mark和_metadata。
文章開頭我們就說過,之所以我們要寫這篇文章,是因?yàn)閷?duì)象頭中有和鎖相關(guān)的運(yùn)行時(shí)數(shù)據(jù),這些運(yùn)行時(shí)數(shù)據(jù)是synchronized以及其他類型的鎖實(shí)現(xiàn)的重要基礎(chǔ)。因?yàn)楸疚闹饕榻B的oop-klass模型,在這里暫時(shí)不對(duì)對(duì)象頭做展開,下一篇文章介紹。
前面介紹到的_metadata是一個(gè)共用體,其中_klass是普通指針,_compressed_klass是壓縮類指針。在深入介紹之前,就要來到oop-Klass中的另外一個(gè)主角klass了。
klass
klass體系
- //klassOop的一部分,用來描述語(yǔ)言層的類型
- class Klass;
- //在虛擬機(jī)層面描述一個(gè)Java類
- class instanceKlass;
- //專有instantKlass,表示java.lang.Class的Klass
- class instanceMirrorKlass;
- //專有instantKlass,表示java.lang.ref.Reference的子類的Klass
- class instanceRefKlass;
- //表示methodOop的Klass
- class methodKlass;
- //表示constMethodOop的Klass
- class constMethodKlass;
- //表示methodDataOop的Klass
- class methodDataKlass;
- //最為klass鏈的端點(diǎn),klassKlass的Klass就是它自身
- class klassKlass;
- //表示instanceKlass的Klass
- class instanceKlassKlass;
- //表示arrayKlass的Klass
- class arrayKlassKlass;
- //表示objArrayKlass的Klass
- class objArrayKlassKlass;
- //表示typeArrayKlass的Klass
- class typeArrayKlassKlass;
- //表示array類型的抽象基類
- class arrayKlass;
- //表示objArrayOop的Klass
- class objArrayKlass;
- //表示typeArrayOop的Klass
- class typeArrayKlass;
- //表示constantPoolOop的Klass
- class constantPoolKlass;
- //表示constantPoolCacheOop的Klass
- class constantPoolCacheKlass;
和oopDesc是其他oop類型的父類一樣,Klass類是其他klass類型的父類。
Klass向JVM提供兩個(gè)功能:
- 實(shí)現(xiàn)語(yǔ)言層面的Java類(在Klass基類中已經(jīng)實(shí)現(xiàn))
- 實(shí)現(xiàn)Java對(duì)象的分發(fā)功能(由Klass的子類提供虛函數(shù)實(shí)現(xiàn))
文章開頭的時(shí)候說過:之所以設(shè)計(jì)oop-klass模型,是因?yàn)镠otSopt JVM的設(shè)計(jì)者不想讓每個(gè)對(duì)象中都含有一個(gè)虛函數(shù)表。
HotSopt JVM的設(shè)計(jì)者把對(duì)象一拆為二,分為klass和oop,其中oop的職能主要在于表示對(duì)象的實(shí)例數(shù)據(jù),所以其中不含有任何虛函數(shù)。而klass為了實(shí)現(xiàn)虛函數(shù)多態(tài),所以提供了虛函數(shù)表。所以,關(guān)于Java的多態(tài),其實(shí)也有虛函數(shù)的影子在。
_metadata是一個(gè)共用體,其中_klass是普通指針,_compressed_klass是壓縮類指針。這兩個(gè)指針都指向instanceKlass對(duì)象,它用來描述對(duì)象的具體類型。
instanceKlass
JVM在運(yùn)行時(shí),需要一種用來標(biāo)識(shí)Java內(nèi)部類型的機(jī)制。在HotSpot中的解決方案是:為每一個(gè)已加載的Java類創(chuàng)建一個(gè)instanceKlass對(duì)象,用來在JVM層表示Java類。
來看下instanceKlass的內(nèi)部結(jié)構(gòu):
- //類擁有的方法列表
- objArrayOop _methods;
- //描述方法順序
- typeArrayOop _method_ordering;
- //實(shí)現(xiàn)的接口
- objArrayOop _local_interfaces;
- //繼承的接口
- objArrayOop _transitive_interfaces;
- //域
- typeArrayOop _fields;
- //常量
- constantPoolOop _constants;
- //類加載器
- oop _class_loader;
- //protected域
- oop _protection_domain;
- ....
可以看到,一個(gè)類該具有的東西,這里面基本都包含了。
這里還有個(gè)點(diǎn)需要簡(jiǎn)單介紹一下。
在JVM中,對(duì)象在內(nèi)存中的基本存在形式就是oop。那么,對(duì)象所屬的類,在JVM中也是一種對(duì)象,因此它們實(shí)際上也會(huì)被組織成一種oop,即klassOop。同樣的,對(duì)于klassOop,也有對(duì)應(yīng)的一個(gè)klass來描述,它就是klassKlass,也是klass的一個(gè)子類。klassKlass作為oop的klass鏈的端點(diǎn)。關(guān)于對(duì)象和數(shù)組的klass鏈大致如下圖:
在這種設(shè)計(jì)下,JVM對(duì)內(nèi)存的分配和回收,都可以采用統(tǒng)一的方式來管理。oop-klass-klassKlass關(guān)系如圖:
內(nèi)存存儲(chǔ)
關(guān)于一個(gè)Java對(duì)象,他的存儲(chǔ)是怎樣的,一般很多人會(huì)回答:對(duì)象存儲(chǔ)在堆上。稍微好一點(diǎn)的人會(huì)回答:對(duì)象存儲(chǔ)在堆上,對(duì)象的引用存儲(chǔ)在棧上。今天,再給你一個(gè)更加顯得牛逼的回答:
對(duì)象的實(shí)例(instantOopDesc)保存在堆上,對(duì)象的元數(shù)據(jù)(instantKlass)保存在方法區(qū),對(duì)象的引用保存在棧上。
其實(shí)如果細(xì)追究的話,上面這句話有點(diǎn)故意賣弄的意思。因?yàn)槲覀兌贾?。方法區(qū)用于存儲(chǔ)虛擬機(jī)加載的類信息、常量、靜態(tài)變量、即時(shí)編譯器編譯后的代碼等數(shù)據(jù)。 所謂加載的類信息,其實(shí)不就是給每一個(gè)被加載的類都創(chuàng)建了一個(gè) instantKlass對(duì)象么。
talk is cheap ,show me the code :
- class Model
- {
- public static int a = 1;
- public int b;
- public Model(int b) {
- this.b = b;
- }
- }
- public static void main(String[] args) {
- int c = 10;
- Model modelA = new Model(2);
- Model modelB = new Model(3);
- }
存儲(chǔ)結(jié)構(gòu)如下:
總結(jié)
每一個(gè)Java類,在被JVM加載的時(shí)候,JVM會(huì)給這個(gè)類創(chuàng)建一個(gè)instanceKlass,保存在方法區(qū),用來在JVM層表示該Java類。當(dāng)我們?cè)贘ava代碼中,使用new創(chuàng)建一個(gè)對(duì)象的時(shí)候,JVM會(huì)創(chuàng)建一個(gè)instanceOopDesc對(duì)象,這個(gè)對(duì)象中包含了兩部分信息,方法頭以及元數(shù)據(jù)。對(duì)象頭中有一些運(yùn)行時(shí)數(shù)據(jù),其中就包括和多線程相關(guān)的鎖的信息。元數(shù)據(jù)其實(shí)維護(hù)的是指針,指向的是對(duì)象所屬的類的instanceKlass。
【本文是51CTO專欄作者Hollis的原創(chuàng)文章,作者微信公眾號(hào)Hollis(ID:hollischuang)】