本文轉(zhuǎn)載自微信公眾號:JavaGuide
基本問題
?介紹下 Java 內(nèi)存區(qū)域(運行時數(shù)據(jù)區(qū))?Java 對象的創(chuàng)建過程(五步,建議能默寫出來并且要知道每一步虛擬機做了什么)?對象的訪問定位的兩種方式(句柄和直接指針兩種方式)
拓展問題
?String類和常量池?8種基本類型的包裝類和常量池
一 概述
對于 Java 程序員來說,在虛擬機自動內(nèi)存管理機制下,不再需要像C/C++程序開發(fā)程序員這樣為內(nèi)一個 new 操作去寫對應的 delete/free 操作,不容易出現(xiàn)內(nèi)存泄漏和內(nèi)存溢出問題。正是因為 Java 程序員把內(nèi)存控制權(quán)利交給 Java 虛擬機,一旦出現(xiàn)內(nèi)存泄漏和溢出方面的問題,如果不了解虛擬機是怎樣使用內(nèi)存的,那么排查錯誤將會是一個非常艱巨的任務(wù)。
二 運行時數(shù)據(jù)區(qū)域
Java 虛擬機在執(zhí)行 Java 程序的過程中會把它管理的內(nèi)存劃分成若干個不同的數(shù)據(jù)區(qū)域。JDK. 1.8 和之前的版本略有不同,下面會介紹到。
JDK 1.8之前:
JDK 1.8 :
線程私有的:
?程序計數(shù)器?虛擬機棧?本地方法棧
線程共享的:
?堆?方法區(qū)?直接內(nèi)存(非運行時數(shù)據(jù)區(qū)的一部分)
2.1 程序計數(shù)器
程序計數(shù)器是一塊較小的內(nèi)存空間,可以看作是當前線程所執(zhí)行的字節(jié)碼的行號指示器。字節(jié)碼解釋器工作時通過改變這個計數(shù)器的值來選取下一條需要執(zhí)行的字節(jié)碼指令,分支、循環(huán)、跳轉(zhuǎn)、異常處理、線程恢復等功能都需要依賴這個計數(shù)器來完。
另外,為了線程切換后能恢復到正確的執(zhí)行位置,每條線程都需要有一個獨立的程序計數(shù)器,各線程之間計數(shù)器互不影響,獨立存儲,我們稱這類內(nèi)存區(qū)域為“線程私有”的內(nèi)存。
從上面的介紹中我們知道程序計數(shù)器主要有兩個作用:
?字節(jié)碼解釋器通過改變程序計數(shù)器來依次讀取指令,從而實現(xiàn)代碼的流程控制,如:順序執(zhí)行、選擇、循環(huán)、異常處理。?在多線程的情況下,程序計數(shù)器用于記錄當前線程執(zhí)行的位置,從而當線程被切換回來的時候能夠知道該線程上次運行到哪兒了。
注意:程序計數(shù)器是唯一一個不會出現(xiàn) OutOfMemoryError 的內(nèi)存區(qū)域,它的生命周期隨著線程的創(chuàng)建而創(chuàng)建,隨著線程的結(jié)束而死亡。
2.2 Java 虛擬機棧
與程序計數(shù)器一樣,Java虛擬機棧也是線程私有的,它的生命周期和線程相同,描述的是 Java 方法執(zhí)行的內(nèi)存模型,每次方法調(diào)用的數(shù)據(jù)都是通過棧傳遞的。
Java 內(nèi)存可以粗糙的區(qū)分為堆內(nèi)存(Heap)和棧內(nèi)存(Stack),其中棧就是現(xiàn)在說的虛擬機棧,或者說是虛擬機棧中局部變量表部分。(實際上,Java虛擬機棧是由一個個棧幀組成,而每個棧幀中都擁有:局部變量表、操作數(shù)棧、動態(tài)鏈接、方法出口信息。)
局部變量表主要存放了編譯器可知的各種數(shù)據(jù)類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型,它不同于對象本身,可能是一個指向?qū)ο笃鹗嫉刂返囊弥羔?,也可能是指向一個代表對象的句柄或其他與此對象相關(guān)的位置)。
Java 虛擬機棧會出現(xiàn)兩種異常:StackOverFlowError 和 OutOfMemoryError。
?StackOverFlowError:若Java虛擬機棧的內(nèi)存大小不允許動態(tài)擴展,那么當線程請求棧的深度超過當前Java虛擬機棧的最大深度的時候,就拋出StackOverFlowError異常。?OutOfMemoryError:若 Java 虛擬機棧的內(nèi)存大小允許動態(tài)擴展,且當線程請求棧時內(nèi)存用完了,無法再動態(tài)擴展了,此時拋出OutOfMemoryError異常。
Java 虛擬機棧也是線程私有的,每個線程都有各自的Java虛擬機棧,而且隨著線程的創(chuàng)建而創(chuàng)建,隨著線程的死亡而死亡。
擴展:那么方法/函數(shù)如何調(diào)用?
Java ??捎妙惐葦?shù)據(jù)結(jié)構(gòu)中棧,Java 棧中保存的主要內(nèi)容是棧幀,每一次函數(shù)調(diào)用都會有一個對應的棧幀被壓入Java棧,每一個函數(shù)調(diào)用結(jié)束后,都會有一個棧幀被彈出。
Java方法有兩種返回方式:
?return 語句。?拋出異常。
不管哪種返回方式都會導致棧幀被彈出。
2.3 本地方法棧
和虛擬機棧所發(fā)揮的作用非常相似,區(qū)別是:虛擬機棧為虛擬機執(zhí)行 Java 方法 (也就是字節(jié)碼)服務(wù),而本地方法棧則為虛擬機使用到的 Native 方法服務(wù)。在 HotSpot 虛擬機中和 Java 虛擬機棧合二為一。
本地方法被執(zhí)行的時候,在本地方法棧也會創(chuàng)建一個棧幀,用于存放該本地方法的局部變量表、操作數(shù)棧、動態(tài)鏈接、出口信息。
方法執(zhí)行完畢后相應的棧幀也會出棧并釋放內(nèi)存空間,也會出現(xiàn) StackOverFlowError 和 OutOfMemoryError 兩種異常。
2.4 堆
Java 虛擬機所管理的內(nèi)存中最大的一塊,Java 堆是所有線程共享的一塊內(nèi)存區(qū)域,在虛擬機啟動時創(chuàng)建。此內(nèi)存區(qū)域的唯一目的就是存放對象實例,幾乎所有的對象實例以及數(shù)組都在這里分配內(nèi)存。
Java 堆是垃圾收集器管理的主要區(qū)域,因此也被稱作GC堆(Garbage Collected Heap).從垃圾回收的角度,由于現(xiàn)在收集器基本都采用分代垃圾收集算法,所以Java堆還可以細分為:新生代和老年代:再細致一點有:Eden空間、From Survivor、To Survivor空間等。進一步劃分的目的是更好地回收內(nèi)存,或者更快地分配內(nèi)存。
上圖所示的 eden區(qū)、s0區(qū)、s1區(qū)都屬于新生代,tentired 區(qū)屬于老年代。大部分情況,對象都會首先在 Eden 區(qū)域分配,在一次新生代垃圾回收后,如果對象還存活,則會進入 s0 或者 s1,并且對象的年齡還會加 1(Eden區(qū)->Survivor 區(qū)后對象的初始年齡變?yōu)?),當它的年齡增加到一定程度(默認為15歲),就會被晉升到老年代中。對象晉升到老年代的年齡閾值,可以通過參數(shù)-XX:MaxTenuringThreshold來設(shè)置。
2.5 方法區(qū)
方法區(qū)與 Java 堆一樣,是各個線程共享的內(nèi)存區(qū)域,它用于存儲已被虛擬機加載的類信息、常量、靜態(tài)變量、即時編譯器編譯后的代碼等數(shù)據(jù)。雖然Java虛擬機規(guī)范把方法區(qū)描述為堆的一個邏輯部分,但是它卻有一個別名叫做 Non-Heap(非堆),目的應該是與 Java 堆區(qū)分開來。
HotSpot 虛擬機中方法區(qū)也常被稱為“永久代”,本質(zhì)上兩者并不等價。僅僅是因為 HotSpot 虛擬機設(shè)計團隊用永久代來實現(xiàn)方法區(qū)而已,這樣 HotSpot 虛擬機的垃圾收集器就可以像管理 Java 堆一樣管理這部分內(nèi)存了。但是這并不是一個好主意,因為這樣更容易遇到內(nèi)存溢出問題。
相對而言,垃圾收集行為在這個區(qū)域是比較少出現(xiàn)的,但并非數(shù)據(jù)進入方法區(qū)后就“永久存在”了。
JDK 1.8 的時候,方法區(qū)被徹底移除了(JDK1.7就已經(jīng)開始了),取而代之是元空間,元空間使用的是直接內(nèi)存。
我們可以使用參數(shù):-XX:MetaspaceSize來指定元數(shù)據(jù)區(qū)的大小。與永久區(qū)很大的不同就是,如果不指定大小的話,隨著更多類的創(chuàng)建,虛擬機會耗盡所有可用的系統(tǒng)內(nèi)存。
2.6 運行時常量池
運行時常量池是方法區(qū)的一部分。Class 文件中除了有類的版本、字段、方法、接口等描述信息外,還有常量池信息(用于存放編譯期生成的各種字面量和符號引用)
既然運行時常量池時方法區(qū)的一部分,自然受到方法區(qū)內(nèi)存的限制,當常量池無法再申請到內(nèi)存時會拋出 OutOfMemoryError 異常。
JDK1.7及之后版本的 JVM 已經(jīng)將運行時常量池從方法區(qū)中移了出來,在 Java 堆(Heap)中開辟了一塊區(qū)域存放運行時常量池。
2.7 直接內(nèi)存
直接內(nèi)存并不是虛擬機運行時數(shù)據(jù)區(qū)的一部分,也不是虛擬機規(guī)范中定義的內(nèi)存區(qū)域,但是這部分內(nèi)存也被頻繁地使用。而且也可能導致 OutOfMemoryError 異常出現(xiàn)。
JDK1.4 中新加入的NIO(New Input/Output) 類,引入了一種基于通道(Channel)與緩存區(qū)(Buffer)的 I/O 方式,它可以直接使用 Native 函數(shù)庫直接分配堆外內(nèi)存,然后通過一個存儲在 Java 堆中的 DirectByteBuffer 對象作為這塊內(nèi)存的引用進行操作。這樣就能在一些場景中顯著提高性能,因為避免了在 Java 堆和 Native 堆之間來回復制數(shù)據(jù)。
本機直接內(nèi)存的分配不會收到 Java 堆的限制,但是,既然是內(nèi)存就會受到本機總內(nèi)存大小以及處理器尋址空間的限制。
三 HotSpot 虛擬機對象探秘
通過上面的介紹我們大概知道了虛擬機的內(nèi)存情況,下面我們來詳細的了解一下 HotSpot 虛擬機在 Java 堆中對象分配、布局和訪問的全過程。
3.1 對象的創(chuàng)建
下圖便是 Java 對象的創(chuàng)建過程,我建議最好是能默寫出來,并且要掌握每一步在做什么。
①類加載檢查:虛擬機遇到一條 new 指令時,首先將去檢查這個指令的參數(shù)是否能在常量池中定位到這個類的符號引用,并且檢查這個符號引用代表的類是否已被加載過、解析和初始化過。如果沒有,那必須先執(zhí)行相應的類加載過程。
②分配內(nèi)存:在類加載檢查通過后,接下來虛擬機將為新生對象分配內(nèi)存。對象所需的內(nèi)存大小在類加載完成后便可確定,為對象分配空間的任務(wù)等同于把一塊確定大小的內(nèi)存從 Java 堆中劃分出來。分配方式有“指針碰撞”和“空閑列表”兩種,選擇那種分配方式由 Java 堆是否規(guī)整決定,而Java堆是否規(guī)整又由所采用的垃圾收集器是否帶有壓縮整理功能決定。
內(nèi)存分配的兩種方式:(補充內(nèi)容,需要掌握)
選擇以上兩種方式中的哪一種,取決于 Java 堆內(nèi)存是否規(guī)整。而 Java 堆內(nèi)存是否規(guī)整,取決于 GC 收集器的算法是"標記-清除",還是"標記-整理"(也稱作"標記-壓縮"),值得注意的是,復制算法內(nèi)存也是規(guī)整的
內(nèi)存分配并發(fā)問題(補充內(nèi)容,需要掌握)
在創(chuàng)建對象的時候有一個很重要的問題,就是線程安全,因為在實際開發(fā)過程中,創(chuàng)建對象是很頻繁的事情,作為虛擬機來說,必須要保證線程是安全的,通常來講,虛擬機采用兩種方式來保證線程安全:
?CAS+失敗重試:CAS 是樂觀鎖的一種實現(xiàn)方式。所謂樂觀鎖就是,每次不加鎖而是假設(shè)沒有沖突而去完成某項操作,如果因為沖突失敗就重試,直到成功為止。虛擬機采用 CAS 配上失敗重試的方式保證更新操作的原子性。?TLAB:為每一個線程預先在Eden區(qū)分配一塊兒內(nèi)存,JVM在給線程中的對象分配內(nèi)存時,首先在TLAB分配,當對象大于TLAB中的剩余內(nèi)存或TLAB的內(nèi)存已用盡時,再采用上述的CAS進行內(nèi)存分配
③初始化零值:內(nèi)存分配完成后,虛擬機需要將分配到的內(nèi)存空間都初始化為零值(不包括對象頭),這一步操作保證了對象的實例字段在 Java 代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對應的零值。
④設(shè)置對象頭:初始化零值完成之后,虛擬機要對對象進行必要的設(shè)置,例如這個對象是那個類的實例、如何才能找到類的元數(shù)據(jù)信息、對象的哈希嗎、對象的 GC 分代年齡等信息。這些信息存放在對象頭中。另外,根據(jù)虛擬機當前運行狀態(tài)的不同,如是否啟用偏向鎖等,對象頭會有不同的設(shè)置方式。
⑤執(zhí)行 init 方法:在上面工作都完成之后,從虛擬機的視角來看,一個新的對象已經(jīng)產(chǎn)生了,但從 Java 程序的視角來看,對象創(chuàng)建才剛開始,<init>方法還沒有執(zhí)行,所有的字段都還為零。所以一般來說,執(zhí)行 new 指令之后會接著執(zhí)行<init>方法,把對象按照程序員的意愿進行初始化,這樣一個真正可用的對象才算完全產(chǎn)生出來。
3.2 對象的內(nèi)存布局
在 Hotspot 虛擬機中,對象在內(nèi)存中的布局可以分為3塊區(qū)域:對象頭、實例數(shù)據(jù)和對齊填充。
Hotspot虛擬機的對象頭包括兩部分信息,第一部分用于存儲對象自身的自身運行時數(shù)據(jù)(哈希碼、GC分代年齡、鎖狀態(tài)標志等等),另一部分是類型指針,即對象指向它的類元數(shù)據(jù)的指針,虛擬機通過這個指針來確定這個對象是那個類的實例。
實例數(shù)據(jù)部分是對象真正存儲的有效信息,也是在程序中所定義的各種類型的字段內(nèi)容。
對齊填充部分不是必然存在的,也沒有什么特別的含義,僅僅起占位作用。因為Hotspot虛擬機的自動內(nèi)存管理系統(tǒng)要求對象起始地址必須是8字節(jié)的整數(shù)倍,換句話說就是對象的大小必須是8字節(jié)的整數(shù)倍。而對象頭部分正好是8字節(jié)的倍數(shù)(1倍或2倍),因此,當對象實例數(shù)據(jù)部分沒有對齊時,就需要通過對齊填充來補全。
3.3 對象的訪問定位
建立對象就是為了使用對象,我們的Java程序通過棧上的 reference 數(shù)據(jù)來操作堆上的具體對象。對象的訪問方式有虛擬機實現(xiàn)而定,目前主流的訪問方式有①使用句柄和②直接指針兩種:
?句柄:如果使用句柄的話,那么Java堆中將會劃分出一塊內(nèi)存來作為句柄池,reference 中存儲的就是對象的句柄地址,而句柄中包含了對象實例數(shù)據(jù)與類型數(shù)據(jù)各自的具體地址信息;
直接指針:?如果使用直接指針訪問,那么 Java 堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關(guān)信息,而reference 中存儲的直接就是對象的地址。
這兩種對象訪問方式各有優(yōu)勢。使用句柄來訪問的最大好處是 reference 中存儲的是穩(wěn)定的句柄地址,在對象被移動時只會改變句柄中的實例數(shù)據(jù)指針,而 reference 本身不需要修改。使用直接指針訪問方式最大的好處就是速度快,它節(jié)省了一次指針定位的時間開銷。
四 重點補充內(nèi)容
String 類和常量池
1 String 對象的兩種創(chuàng)建方式:
?????String?str1?=?"abcd";?????String?str2?=?new?String("abcd");?????System.out.println(str1==str2);//false
這兩種不同的創(chuàng)建方法是有差別的,第一種方式是在常量池中拿對象,第二種方式是直接在堆內(nèi)存空間創(chuàng)建一個新的對象。
記?。褐灰褂胣ew方法,便需要創(chuàng)建新的對象。
2 String 類型的常量池比較特殊。它的主要使用方法有兩種:
?直接使用雙引號聲明出來的 String 對象會直接存儲在常量池中。?如果不是用雙引號聲明的 String 對象,可以使用 String 提供的 intern 方法。String.intern() 是一個 Native 方法,它的作用是:如果運行時常量池中已經(jīng)包含一個等于此 String 對象內(nèi)容的字符串,則返回常量池中該字符串的引用;如果沒有,則在常量池中創(chuàng)建與此 String 內(nèi)容相同的字符串,并返回常量池中創(chuàng)建的字符串的引用。
??????????String?s1?=?new?String("計算機");??????????String?s2?=?s1.intern();??????????String?s3?=?"計算機";??????????System.out.println(s2);//計算機??????????System.out.println(s1?==?s2);//false,因為一個是堆內(nèi)存中的String對象一個是常量池中的String對象,??????????System.out.println(s3?==?s2);//true,因為兩個都是常量池中的String對象
3 String 字符串拼接
? ? ? ? ?String str1 = "str"; ? ? ? ? ?String str2 = "ing"; ? ? ? ? ?String str3 = "str" + "ing";//常量池中的對象 ? ? ? ? ?String str4 = str1 + str2; //在堆上創(chuàng)建的新的對象 ? ? ? ? ? ? ? ?String str5 = "string";//常量池中的對象 ? ? ? ? ?System.out.println(str3 == str4);//false ? ? ? ? ?System.out.println(str3 == str5);//true ? ? ? ? ?System.out.println(str4 == str5);//false
盡量避免多個字符串拼接,因為這樣會重新創(chuàng)建對象。如果需要改變字符串的話,可以使用 StringBuilder 或者 StringBuffer。
String s1 = new String("abc");這句話創(chuàng)建了幾個對象?
創(chuàng)建了兩個對象。
驗證:
????????String?s1?=?new?String("abc");//?堆內(nèi)存的地址值????????String?s2?=?"abc";????????System.out.println(s1?==?s2);//?輸出false,因為一個是堆內(nèi)存,一個是常量池的內(nèi)存,故兩者是不同的。????????System.out.println(s1.equals(s2));//?輸出true
結(jié)果:
falsetrue
解釋:
先有字符串"abc"放入常量池,然后 new 了一份字符串"abc"放入Java堆(字符串常量"abc"在編譯期就已經(jīng)確定放入常量池,而 Java 堆上的"abc"是在運行期初始化階段才確定),然后 Java 棧的 str1 指向Java堆上的"abc"。
8種基本類型的包裝類和常量池
?Java 基本類型的包裝類的大部分都實現(xiàn)了常量池技術(shù),即Byte,Short,Integer,Long,Character,Boolean;這5種包裝類默認創(chuàng)建了數(shù)值[-128,127]的相應類型的緩存數(shù)據(jù),但是超出此范圍仍然會去創(chuàng)建新的對象。?兩種浮點數(shù)類型的包裝類 Float,Double 并沒有實現(xiàn)常量池技術(shù)
????????Integer?i1?=?33;????????Integer?i2?=?33;????????System.out.println(i1?==?i2);//?輸出true????????Integer?i11?=?333;????????Integer?i22?=?333;????????System.out.println(i11?==?i22);//?輸出false????????Double?i3?=?1.2;????????Double?i4?=?1.2;????????System.out.println(i3?==?i4);//?輸出false
Integer 緩存源代碼:
/***此方法將始終緩存-128到127(包括端點)范圍內(nèi)的值,并可以緩存此范圍之外的其他值。*/ ? ?public static Integer valueOf(int i) { ? ? ? ?if (i >= IntegerCache.low && i <= IntegerCache.high) ? ? ? ? ? ?return IntegerCache.cache[i + (-IntegerCache.low)]; ? ? ? ?return new Integer(i); ? ?}
應用場景:
?Integer i1=40;Java 在編譯的時候會直接將代碼封裝成Integer i1=Integer.valueOf(40);,從而使用常量池中的對象。?Integer i1 = new Integer(40);這種情況下會創(chuàng)建新的對象。
??Integer?i1?=?40;??Integer?i2?=?new?Integer(40);??System.out.println(i1==i2);//輸出false
Integer比較更豐富的一個例子:
?Integer i1 = 40; ?Integer i2 = 40; ?Integer i3 = 0; ?Integer i4 = new Integer(40); ?Integer i5 = new Integer(40); ?Integer i6 = new Integer(0); ?System.out.println("i1=i2 ? " + (i1 == i2)); ?System.out.println("i1=i2+i3 ? " + (i1 == i2 + i3)); ?System.out.println("i1=i4 ? " + (i1 == i4)); ?System.out.println("i4=i5 ? " + (i4 == i5)); ?System.out.println("i4=i5+i6 ? " + (i4 == i5 + i6)); ?? ?System.out.println("40=i5+i6 ? " + (40 == i5 + i6)); ? ?
結(jié)果:
i1=i2???truei1=i2+i3???truei1=i4???falsei4=i5???falsei4=i5+i6???true40=i5+i6???true
解釋:
語句i4 == i5 + i6,因為+這個操作符不適用于Integer對象,首先i5和i6進行自動拆箱操作,進行數(shù)值相加,即i4 == 40。然后Integer對象無法與數(shù)值進行直接比較,所以i4自動拆箱轉(zhuǎn)為int值40,最終這條語句轉(zhuǎn)為40 == 40進行數(shù)值比較。