Kodierung und Dekodierung von UTF-8-Byte-Arrays und Java-Strings
In Java erfordert die Bearbeitung von Textdaten nahtlose Konvertierungen zwischen Strings und Byte-Arrays in verschiedene Kodierungen. In diesem Artikel wird untersucht, wie diese Konvertierungen effizient durchgeführt werden können, wobei der Schwerpunkt auf der weit verbreiteten UTF-8-Kodierung liegt.
Zeichenfolgen in Byte-Arrays kodieren
So konvertieren Sie eine Java-Zeichenfolge in Um ein UTF-8-codiertes Byte-Array zu erstellen, verwenden Sie die Methode getBytes(). Zum Beispiel:
String str = "Hello, world!"; byte[] byteArray = str.getBytes(StandardCharsets.UTF_8);
Byte-Arrays in Strings dekodieren
Um einen Java-String aus einem bestimmten Byte-Array zu erhalten, verwenden Sie den neuen String()-Konstruktor und geben Sie an gewünschte Kodierung. Beispiel:
byte[] byteArray = {(byte) 72, (byte) 101, (byte) 108, (byte) 108, (byte) 111}; String str = new String(byteArray, StandardCharsets.UTF_8);
Bedeutung der Kodierungsspezifikation
Die Auswahl der geeigneten Kodierung ist entscheidend für korrekte String-Konvertierungen. UTF-8 ist eine vielseitige Kodierung, die die meisten in menschlichen Sprachen vorkommenden Zeichen unterstützt. Für andere Codierungsanforderungen wählen Sie jedoch die entsprechende Codierungskonstante aus der StandardCharsets-Klasse.
Das obige ist der detaillierte Inhalt vonWie kodiere und dekodiere ich UTF-8-Byte-Arrays und Java-Strings?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!