深入理解JVM虛擬機器:(一)Java執行時資料區域

深入理解JVM虛擬機器:(一)Java執行時資料區域

概述

JVM是Java語言的精髓所在,因為它Java語言實現了跨平臺執行,以及自動記憶體管理機制等,本文將從概念上介紹JVM記憶體的各個區域,說明個區域的作用。

JVM執行時資料區模型

Java虛擬機器在執行Java程式的過程中會把它所管理的記憶體劃分成若干個不同的資料區域,這些資料區域都有各自的用途,以及建立和銷燬時間,Java虛擬機器所管理的記憶體將會包括以下幾個執行時數區域

Java虛擬機器執行時資料區

程式計數器

程式計數器是一塊比較小的記憶體空間,它可以看做是當前執行緒所執行的位元組碼的行號指示器。在虛擬機器的概念模型裡,位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。

由於Java虛擬機器的多執行緒是通過執行緒輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時間,一個處理器都只會執行一條執行緒中的指令。因此,為了執行緒切換後能恢復到正確的執行位置,每條執行緒都需要有一個獨立的程式計數器,各條執行緒之間計數器互不影響,獨立儲存,我們稱這類記憶體區域為“執行緒私有”的記憶體。

如果執行緒正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機器位元組碼指令的地址;如果正在執行的是Native方法,這個計數器值則為空。次記憶體區域是唯一一個在Java虛擬機器規範中沒有規定任何OutOfMemoryError情況的區域。

Java虛擬機器棧

與程式計數器一樣,Java虛擬機器棧也是執行緒私有的,它的生命週期與執行緒相同。虛擬機器棧描述的是Java方法執行的記憶體模型,每個方法在執行的同時都會建立一個棧幀用於儲存區域性變數表、運算元棧、冬天連結、方法出口等資訊,每一個方法從呼叫直至執行完成的過程,就對應著一個棧幀在虛擬機器棧中入棧到出棧的過程。

經常有人把Java記憶體區分為堆記憶體和棧記憶體,這種分發比較粗糙,Java記憶體區域的劃分實現上遠比這個複雜。這種劃分方式比較流行只能說明大多數程式設計師最關注的,與物件記憶體分配關係最密切的記憶體區域就是這兩塊。所指的“堆”在後面會講到,所指的“棧”就是現在正在說的虛擬機器棧,或者說是虛擬機器棧中的區域性變數表部分。

區域性變數表存放了編譯期可知的各種基本資料型別(boolean、byte、short、char、int、float、long、double)、物件引用(reference型別)和returnAddress型別。

其中64位長度的long和double型別的資料會佔用兩個區域性變數空間,其餘的資料型別只佔用一個。區域性變數表所需的記憶體空間在編譯器以及完成分配,當進入一個方法時,這個方法所需要在棧幀中分配多大的區域性變數空間是完全確定的,在方法執行期間不會改變區域性變數表的大小。

在Java虛擬機器規範中,對這個區域規定了兩種異常狀況:如果執行緒請求的棧深度大於虛擬機器所允許的深度,將丟擲StackOverflowError異常;如果虛擬機器可以動態擴充套件,如果擴充套件時無法申請到足夠的記憶體,就會丟擲OutOfMemoryError異常。

本地方法棧

本地方法棧與虛擬機器棧所發揮的作用是非常相似的,它們之間的區別不過是虛擬機器棧位虛擬機器執行Java方法服務,而本地方法棧則為虛擬機器使用到的Native方法服務。在虛擬機器規範中堆本地方法棧中的方法使用的語言、使用的方式與資料結構沒有強制的規定,因此具體的虛擬機器可以自由實現它。

Java堆

對於大多數應用來說,Java堆是Java虛擬機器所管理的記憶體中最大的一塊。Java堆是被所有執行緒共享的一塊記憶體區域,在虛擬機器啟動時建立。次記憶體區域的唯一目的就是存放物件順利,幾乎所有的物件實力都在這裡進行分配。這一點Java虛擬機器規範中的描述是:所有的物件例項以及資料都要在堆上分配,但是隨著JIT編譯器的發展和逃逸分析技術逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化發生,所有的物件都分配在多少也逐漸變得不是那麼“絕對”了。

Java堆是垃圾收集器管理的主要區域,因此很多時候也被成為”GC堆”。從記憶體回收的角度來看,由於現在的收集器基本上都採用分代收集演算法,所以Java堆還可以細分為:新生代和老年代;再細緻一點可以分為Eden空間、From Survivor空間、To survivor空間等。從記憶體分配的角度來看,執行緒共享的Java堆中可能劃分出多個執行緒私有的分配緩衝區,不過無論如何劃分,都與存放內容無關,無論哪個區域,儲存的都依然是物件例項,進一步劃分的目的是為了更好地回收記憶體,或者更快的分配記憶體。在堆中沒有記憶體完成例項分配,並且堆也無法再擴充套件時,將會丟擲OutOfMemoryError異常。

方法區

方法區與Java堆一樣,是各個執行緒共享的記憶體區域,它用於儲存已被虛擬機器載入的類資訊、常量、靜態變數、即時編譯器編譯後的程式碼等資料。雖然Java虛擬機器規範把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做“非堆”,目的應該是與Java堆區分開來。

很多人都願意把方法區稱為永久代,本質上兩者並不等價,僅僅是因為HotSpot虛擬機器的設計團隊選擇把GC分代收集擴充套件至方法區,或者說使用永久代來實現方法區而已,這樣HotSpot的垃圾收集器可以像管理Java堆一樣管理這部分記憶體,能夠省去專門為方法區編寫記憶體管理程式碼的工作。對於其他虛擬機器,不存在永久代的概念。原則上,如何實現方法區是屬於虛擬機器的實現細節,不受虛擬機器規範束縛。
Java虛擬機器規範對方法區的限制非常的寬鬆,除了和Java堆一樣不需要連續的記憶體和可以選擇固定大小或者可擴充套件意外,還可以選擇不實現垃圾收集,相對而言,垃圾收集行為在這個區域是比較少出現的,但並非資料進入了方法區就如永久代的名字一樣“永久”存在了。這個區域的記憶體回收目標主要是針對常量池的回收和堆型別的解除安裝,一般來說,這個區域的回收確實是必要的。當方法區無法滿足記憶體分配的需求時,將丟擲OutOfMemoryError異常。

執行常量池

執行常量池是方法區的一部分。Class檔案中除了有類的版本、欄位、方法、介面等描述資訊外,還有一項資訊是常量池,用於存放編譯器生成的各個字面量和符號引用,這部門內容將在類載入後進入方法區的執行時常量池存放。

Java虛擬機器堆Class檔案每一部分的格式都有嚴格的規定,每一個位元組用於儲存哪種資料都必須符合規範上的要求才會被虛擬機器認可、裝載和執行,但對於執行時常量池,Java虛擬機器規範每一個做任何細節上的要求,不同的供應商實現的虛擬機器可以按照自己的要求來實現這個記憶體區域。不過,一般來說,除了保持Class檔案中描述的符號引用外,還會把翻譯出來的直接引用也儲存在執行常量池中。

執行常量池相對於Class檔案常量池的另外一個重要特性是具備動態性,Java語言並不要求常量一定只有在編譯期才能生成,也就是並非預置入Class檔案中的常量池的內容才能進入方法區執行時常量池,執行期間也可能將心的常量放入池中,這種特性被開發人員利用的比較多的就是String類的intern()方法。

常量池無法再申請到記憶體時會丟擲OutOfMemoryError異常。

直接記憶體

直接記憶體不是虛擬機器執行時資料區的一部分,也不是Java虛擬機器規範中定義的記憶體區域。但是這部分的記憶體也被頻繁的使用,而且也可能導致記憶體溢位的異常。

在JDK1.4中加入了NIO類,引入了一種基於通道的I/O方式,它可以使用Native函式庫直接分配堆外記憶體,然後通過一個儲存在Java堆中的DirectByteBuffer物件作為這塊記憶體的引用進行操作。這樣能在一些場景中顯著的提高效能,因為避免了在Java堆和Native堆中來回複製資料。

顯然,本機直接記憶體的分配不受到Java堆大小的限制,但是,既然是記憶體,肯定還是會受到本機總記憶體大小以及處理器定址空間的限制。

本文參考自:《深入理解Java虛擬機器》

轉載請註明出處

更多Java乾貨文章請關注我的個人微信公眾號:老宣與你聊Java

這裡寫圖片描述