計算Java 中字串的位元組數
在Java 中,字串由字元組成,字元的位元組表示形式可能因不同而異所選的編碼。要確定字串中的位元組數,必須考慮用於將其轉換為位元組的字元編碼。
編碼相關位元組數
理解的關鍵字節數是指不同的編碼會導致相同字串的位元組大小不同。例如,以 UTF-8 編碼的字串可能需要每個字元 1 個位元組,而以 UTF-16 編碼的字串可能需要每個字元 2 個位元組。
將字串轉換為位元組
要計算位元組數,我們可以使用getBytes() 方法將字串轉換為位元組數組:
<code class="java">byte[] utf8Bytes = string.getBytes("UTF-8"); byte[] utf16Bytes = string.getBytes("UTF-16");</code>
結果位元組數組的長度提供了該特定編碼的位元組數:
<code class="java">int utf8ByteCount = utf8Bytes.length; int utf16ByteCount = utf16Bytes.length;</code>
範例
考慮字串「Hello World 」:
<code class="java">String string = "Hello World"; // Print the number of characters in the string System.out.println(string.length()); // 11 // Calculate the byte count for different encodings byte[] utf8Bytes = string.getBytes("UTF-8"); byte[] utf16Bytes = string.getBytes("UTF-16"); byte[] utf32Bytes = string.getBytes("UTF-32"); // Print the byte counts System.out.println(utf8Bytes.length); // 11 System.out.println(utf16Bytes.length); // 24 System.out.println(utf32Bytes.length); // 44</code>
注意事項
將字串轉換為位元組時,必須明確指定所需的字元編碼。依賴預設值可能會導致意外結果,尤其是在使用使用非 ASCII 字元的語言時。
此外,請注意某些編碼(如 UTF-8)可能會使用字元的可變長度編碼。這意味著單一字元可以由不同數量的位元組表示,進一步凸顯了編碼選擇的重要性。
以上是Java 字串佔用多少字節,為什麼答案取決於它的編碼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!