Java での文字列と UTF-8 バイト配列間の変換
Java では、文字列とバイト配列間のエンコードおよびデコード操作が発生する可能性があります。さまざまなシナリオ。この記事では、これらの変換についての簡潔なガイドを提供し、特に UTF-8 エンコードに焦点を当てます。
文字列を UTF-8 バイト配列にエンコードする
文字列をエンコードするにはUTF-8 バイト配列に変換するには、String クラスの getBytes メソッドを使用します。このメソッドは、StandardCharsets.UTF_8 などのエンコーディング名を引数として受け取ります。
String s = "some text here"; byte[] b = s.getBytes(StandardCharsets.UTF_8);
UTF-8 バイト配列を String にデコードします
To decode a UTF-8 バイト配列を文字列に変換するには、新しい String コンストラクターを使用し、適切なエンコーディングを指定します。 name.
byte[] b = {(byte) 99, (byte) 97, (byte) 116}; String s = new String(b, StandardCharsets.US_ASCII);
適切な文字表現を保証するには、どちらの場合も正しいエンコーディング名を使用することが重要です。一般的なエンコード オプションには、より広範囲の文字をサポートする US-ASCII と UTF-8 が含まれます。
適切なエンコードの選択は、処理されるデータのコンテキストと性質によって異なることに注意してください。
以上がJava で文字列と UTF-8 バイト配列の間で変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。