Was ist Javas interne Darstellung für Zeichenfolgen: Modifiziertes UTF-8 oder UTF-16?
Java verwendet UTF-16 für seinen internen Text Darstellung, wie in der Oracle-Dokumentation angegeben. Diese Darstellung gilt für verschiedene Datenstrukturen und Klassen, die Zeichenfolgen innerhalb der Java-Plattform speichern, wie z. B. String und StringBuilder. Eine 16-Bit-Ganzzahl ohne Vorzeichen (char) in Java kann einen Unicode-Codepunkt oder Codeeinheiten von UTF-16 darstellen.
Java verwendet jedoch auch eine nicht standardmäßige Modifikation von UTF-8 für die String-Serialisierung. Dies bedeutet, dass serialisierte Zeichenfolgen standardmäßig im UTF-8-Format gespeichert werden.
Für die Speicherung im Speicher verwendet Java 2 Bytes für einen char-Datentyp. Beachten Sie, dass Codepunkte möglicherweise eine oder zwei char-Instanzen erfordern, was zu 2 bzw. 4 Byte Speicherplatz führt.
Das obige ist der detaillierte Inhalt vonWie stellt Java Strings intern dar: UTF-8 oder UTF-16?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!