Java での文字列バイトのカウント
Java では、文字列は可変バイト数を含む文字のコレクションです。文字列が占めるバイト数は、エンコードに使用される文字セットによって異なります。
エンコードされたバイト数の取得
文字列内のバイト数を確認するには、次のようにします。 getBytes() メソッドを使用してバイト配列に変換できます。このメソッドは、エンコード形式を引数として受け取り、エンコードされた文字列が入力されたバイト配列を返します。配列の長さは、エンコードされた文字列のバイト数を表します。
例:
<code class="java">String string = "Hello World"; // Get UTF-8 encoded byte count byte[] utf8Bytes = string.getBytes("UTF-8"); System.out.println(utf8Bytes.length); // prints 11 // Get UTF-16 encoded byte count byte[] utf16Bytes = string.getBytes("UTF-16"); System.out.println(utf16Bytes.length); // prints 24 // Get UTF-32 encoded byte count byte[] utf32Bytes = string.getBytes("UTF-32"); System.out.println(utf32Bytes.length); // prints 44</code>
エンコードのバリエーション
例からわかるように、「Hello World」のような ASCII 文字列でも、使用されるエンコーディングに応じてバイト数が異なる場合があります。
文字セット
これは重要です。文字列をエンコードするときに適切な文字セットを選択します。文字セットが異なれば、文字をバイトとして表す方法も異なるため、バイト数も異なります。
デフォルトの文字セット
文字セットを指定しない場合、Javaプラットフォームのデフォルトの文字セットを使用します。ただし、一貫した結果を保証するために、デフォルトに依存することは避け、文字セットを明示的に指定することをお勧めします。
以上がJava 文字列は何バイトを占めますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。