Encodage et décodage des tableaux d'octets UTF-8 et des chaînes Java
En Java, la manipulation de données texte nécessite des conversions transparentes entre les chaînes et les tableaux d'octets dans divers codages. Cet article explique comment effectuer ces conversions efficacement, en se concentrant sur le codage UTF-8 largement utilisé.
Encodage de chaînes en tableaux d'octets
Pour convertir une chaîne Java en un tableau d'octets codé en UTF-8, utilisez la méthode getBytes(). Par exemple :
String str = "Hello, world!"; byte[] byteArray = str.getBytes(StandardCharsets.UTF_8);
Décoder des tableaux d'octets en chaînes
Pour obtenir une chaîne Java à partir d'un tableau d'octets donné, utilisez le nouveau constructeur String(), en spécifiant le encodage souhaité. Exemple :
byte[] byteArray = {(byte) 72, (byte) 101, (byte) 108, (byte) 108, (byte) 111}; String str = new String(byteArray, StandardCharsets.UTF_8);
Importance de la spécification d'encodage
La sélection de l'encodage approprié est cruciale pour des conversions de chaînes correctes. UTF-8 est un codage polyvalent qui prend en charge la plupart des caractères présents dans les langues humaines. Cependant, pour d'autres besoins d'encodage, choisissez la constante d'encodage appropriée dans la classe StandardCharsets.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!