Conversion de chaînes codées Unicode en lettres Unicode
Lorsque vous travaillez avec des données texte, il est courant de rencontrer des chaînes contenant des caractères Unicode échappés. Ces caractères, représentés par « uXXXX », peuvent rendre difficile la recherche et la manipulation efficace du texte. Cet article explique comment convertir de telles chaînes codées Unicode en lettres Unicode normales à l'aide de la bibliothèque Apache Commons Lang.
Prenons un exemple : nous avons une chaîne avec des caractères Unicode, "u0048u0065u006Cu006Cu006F World". Notre objectif est de convertir cette chaîne en lettres Unicode correspondantes, ce qui donne "Hello World".
Pour résoudre ce problème, nous pouvons exploiter la méthode unescapeJava() de la bibliothèque Apache Commons Lang. Cette méthode est spécifiquement conçue pour décoder les caractères Unicode échappés par Java.
Voici un exemple de code qui montre comment utiliser cette méthode :
import org.apache.commons.lang.StringEscapeUtils; public class UnicodeConverter { public static void main(String[] args) { String escapedString = "\u0048\u0065\u006C\u006C\u006F World"; String unescapedString = StringEscapeUtils.unescapeJava(escapedString); System.out.println("Escaped string: " + escapedString); System.out.println("Unescaped string: " + unescapedString); } }
Sortie :
Escaped string: \u0048\u0065\u006C\u006C\u006F World Unescaped string: Hello World
En utilisant la méthode StringEscapeUtils.unescapeJava(), nous pouvons facilement convertir les chaînes codées Unicode en leurs lettres Unicode correspondantes. Cela permet un traitement de texte plus efficace, y compris les opérations de recherche et de comparaison.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!