Conversion entre des chaînes et des tableaux d'octets UTF-8 en Java
En Java, les opérations d'encodage et de décodage entre les chaînes et les tableaux d'octets peuvent survenir dans divers scénarios. Cet article fournit un guide concis sur ces conversions, en se concentrant spécifiquement sur l'encodage UTF-8.
Encodage d'une chaîne dans un tableau d'octets UTF-8
Pour encoder une chaîne dans un tableau d'octets UTF-8, utilisez la méthode getBytes de la classe String. Cette méthode prend un nom d'encodage comme argument, tel que StandardCharsets.UTF_8.
String s = "some text here"; byte[] b = s.getBytes(StandardCharsets.UTF_8);
Décoder un tableau d'octets UTF-8 en une chaîne
Pour décoder un Tableau d'octets UTF-8 dans une chaîne, utilisez le nouveau constructeur String et spécifiez l'encodage approprié nom.
byte[] b = {(byte) 99, (byte) 97, (byte) 116}; String s = new String(b, StandardCharsets.US_ASCII);
Il est crucial d'utiliser les noms d'encodage corrects dans les deux cas pour garantir une représentation correcte des caractères. Les options de codage courantes incluent US-ASCII et UTF-8, qui prennent en charge une plus large gamme de caractères.
Notez que le choix du codage approprié dépend du contexte et de la nature des données traitées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!