Comptage des octets de chaîne en Java
En Java, les chaînes sont une collection de caractères pouvant contenir un nombre variable d'octets. Le nombre d'octets qu'une chaîne occupe dépend du jeu de caractères utilisé pour l'encoder.
Obtention du nombre d'octets codés
Pour déterminer le nombre d'octets dans une chaîne, vous pouvez le convertir en tableau d'octets en utilisant la méthode getBytes(). Cette méthode prend un format de codage comme argument et renvoie un tableau d'octets rempli avec la chaîne codée. La longueur du tableau représente le nombre d'octets dans la chaîne codée.
Exemple :
<code class="java">String string = "Hello World"; // Get UTF-8 encoded byte count byte[] utf8Bytes = string.getBytes("UTF-8"); System.out.println(utf8Bytes.length); // prints 11 // Get UTF-16 encoded byte count byte[] utf16Bytes = string.getBytes("UTF-16"); System.out.println(utf16Bytes.length); // prints 24 // Get UTF-32 encoded byte count byte[] utf32Bytes = string.getBytes("UTF-32"); System.out.println(utf32Bytes.length); // prints 44</code>
Variations d'encodage
Comme vous pouvez le voir dans l'exemple, même une chaîne ASCII comme "Hello World" peut avoir un nombre d'octets différent selon l'encodage utilisé.
Jeux de caractères
C'est crucial pour sélectionner le jeu de caractères approprié lors de l’encodage d’une chaîne. Différents jeux de caractères utilisent différentes méthodes pour représenter les caractères sous forme d'octets, ce qui entraîne un nombre d'octets variable.
Jeu de caractères par défaut
Si vous ne spécifiez pas de jeu de caractères, Java utilise le jeu de caractères par défaut de la plateforme. Cependant, il est conseillé d'éviter de s'appuyer sur les valeurs par défaut et de spécifier explicitement le jeu de caractères pour garantir des résultats cohérents.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!