java常數池是一個經久不衰的話題,也是面試官的最愛,題目花樣百出,小菜早就對常量池有所耳聞,這次好好總結一下。
推薦:java影片教學
jvm虛擬記憶體分佈:
程式計數器是jvm執行程式的流水線,存放一些跳躍指令,這個太高深,小菜不懂。
本機方法堆疊是jvm呼叫作業系統方法所使用的堆疊。
虛擬機器堆疊是jvm執行java程式碼所使用的堆疊。
方法區存放了一些常數、靜態變數、類別資訊等,可以理解成class檔案在記憶體中的存放位置。
虛擬機器堆是jvm執行java程式碼所使用的堆。
Java中的常數池,實際上分為兩種形態:靜態常數池和執行時間常數池。
所謂靜態常數池,即*.class檔案中的常數池,class檔案中的常數池不只包含字串(數字)字面量,還包含類別、方法的信息,佔用class檔案絕大部分空間。
而運行時常數池,則是jvm虛擬機器在完成類別裝載作業後,將class檔案中的常數池載入到記憶體中,並保存在方法區中,我們常說的常數池,就是指方法區中的運行時常量池。
接下來我們引用一些網路上流行的常數池例子,然後藉以講解。
String s1 = "Hello"; String s2 = "Hello"; String s3 = "Hel" + "lo"; String s4 = "Hel" + new String("lo"); String s5 = new String("Hello"); String s6 = s5.intern(); String s7 = "H"; String s8 = "ello"; String s9 = s7 + s8; System.out.println(s1 == s2); // true System.out.println(s1 == s3); // true System.out.println(s1 == s4); // false System.out.println(s1 == s9); // false System.out.println(s4 == s5); // false System.out.println(s1 == s6); // true
首先說明一點,在java 中,直接使用==運算符,比較的是兩個字串的參考位址,並不是比較內容,比較內容請用String.equals()。
s1 == s2這個非常好理解,s1、s2在賦值時,均使用的字串字面量,說白話點,就是直接把字串寫死,在編譯期間,這種字面量會直接放入class檔案的常數池中,從而實現重複使用,載入運行時常數池後,s1、s2指向的是同一個記憶體位址,所以相等。
s1 == s3這個地方有個坑,s3雖然是動態拼接出來的字串,但是所有參與拼接的部分都是已知的字面量,在編譯期間,這種拼接會被優化,編譯器直接幫你拼好,所以String s3 = "Hel" "lo";在class檔案中被最佳化成String s3 = "Hello";,所以s1 == s3成立。
s1 == s4當然不相等,s4雖然也是拼接出來的,但new String("lo")這部分不是已知字面量,是一個不可預料的部分,編譯器不會優化,必須等到運行時才可以確定結果,結合字串不變定理,鬼知道s4被分配到哪裡去了,所以地址肯定不同。配上一張簡圖理清思路:
s1 == s9也不相等,道理差不多,雖然s7、s8在賦值的時候使用的字符串字面量,但是拼接成s9的時候, s7、s8作為兩個變量,都是不可預料的,編譯器畢竟是編譯器,不可能當解釋器用,所以不做優化,等到運行時,s7、s8拼接成的新字符串,在堆中地址不確定,不可能與方法區常數池中的s1位址相同。
s4 == s5已經不用解釋了,絕對不相等,二者都在堆中,但位址不同。
s1 == s6這兩個相等完全歸功於intern方法,s5在堆中,內容為Hello ,intern方法會嘗試將Hello字串添加到常數池中,並返回其在常數池中的位址,因為常數池中已經有了Hello字串,所以intern方法直接回傳位址;而s1在編譯期就已經指向常數池了,因此s1和s6指向同一位址,相等。
至此,我們可以得到三個非常重要的結論:
#必須專注於編譯期的行為,才能更好的理解常數池。
運行時常數池中的常數,基本上來自各個class檔案中的常數池。
程式執行時,除非手動在常數池中新增常數(例如呼叫intern方法),否則jvm不會自動加入常數到常數池。
以上所講只涉及字串常數池,實際上還有整數常數池、浮點型常數池等等,但都大同小異,只不過數值類型的常數池不可以手動添加常數,程式啟動時常數池中的常數就已經確定了,例如整型常數池中的常數範圍:-128~127,只有這個範圍的數字可以用到常數池。
實務
說了這麼多理論,接下來讓我們觸摸真正的常數池。
前文提到過,class檔案中存在一個靜態常數池,這個常數池是由編譯器產生的,用來儲存java原始檔中的字面量(本文僅關注字面量),假設我們有如下java程式碼:
String s = "hi";
为了方便起见,就这么简单,没错!将代码编译成class文件后,用winhex打开二进制格式的class文件。如图:
简单讲解一下class文件的结构,开头的4个字节是class文件魔数,用来标识这是一个class文件,说白话点就是文件头,既:CA FE BA BE。
紧接着4个字节是java的版本号,这里的版本号是34,因为笔者是用jdk8编译的,版本号的高低和jdk版本的高低相对应,高版本可以兼容低版本,但低版本无法执行高版本。所以,如果哪天读者想知道别人的class文件是用什么jdk版本编译的,就可以看这4个字节。
接下来就是常量池入口,入口处用2个字节标识常量池常量数量,本例中数值为00 1A,翻译成十进制是26,也就是有25个常量,其中第0个常量是特殊值,所以只有25个常量。
常量池中存放了各种类型的常量,他们都有自己的类型,并且都有自己的存储规范,本文只关注字符串常量,字符串常量以01开头(1个字节),接着用2个字节记录字符串长度,然后就是字符串实际内容。本例中为:01 00 02 68 69。
接下来再说说运行时常量池,由于运行时常量池在方法区中,我们可以通过jvm参数:-XX:PermSize、-XX:MaxPermSize来设置方法区大小,从而间接限制常量池大小。
假设jvm启动参数为:-XX:PermSize=2M -XX:MaxPermSize=2M,然后运行如下代码:
//保持引用,防止自动垃圾回收 List<String> list = new ArrayList<String>(); int i = 0; while(true){ //通过intern方法向常量池中手动添加常量 list.add(String.valueOf(i++).intern()); }
程序立刻会抛出:Exception in thread "main" java.lang.outOfMemoryError: PermGen space异常。PermGen space正是方法区,足以说明常量池在方法区中。
在jdk8中,移除了方法区,转而用Metaspace区域替代,所以我们需要使用新的jvm参数:-XX:MaxMetaspaceSize=2M,依然运行如上代码,抛出:java.lang.OutOfMemoryError: Metaspace异常。同理说明运行时常量池是划分在Metaspace区域中。具体关于Metaspace区域的知识,请读者自行搜索。
更多java知识请关注java基础教程栏目。
以上是java常量池圖文詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!