Maison > Java > javaDidacticiel > Comment Java représente-t-il en interne les chaînes : UTF-8 ou UTF-16 ?

Comment Java représente-t-il en interne les chaînes : UTF-8 ou UTF-16 ?

Patricia Arquette
Libérer: 2024-11-10 07:12:02
original
793 Les gens l'ont consulté

How does Java internally represent Strings: UTF-8 or UTF-16?

Quelle est la représentation interne de Java pour une chaîne : UTF-8 ou UTF-16 modifié ?

Java utilise UTF-16 pour son texte interne représentation, comme indiqué dans la documentation Oracle. Cette représentation s'applique à diverses structures de données et classes qui stockent des séquences de caractères au sein de la plate-forme Java, telles que String et StringBuilder. Un entier non signé (caractère) de 16 bits en Java peut représenter un point de code Unicode ou des unités de code UTF-16.

Cependant, Java utilise également une modification non standard d'UTF-8 pour la sérialisation des chaînes. Cela signifie que les chaînes sérialisées sont stockées par défaut au format UTF-8.

Pour le stockage en mémoire, Java utilise 2 octets pour un type de données char. Notez que les points de code peuvent nécessiter une ou deux instances de caractères, ce qui entraîne respectivement 2 ou 4 octets d'espace de stockage.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal