Unicode-codierte Strings in Buchstabenstrings konvertieren
In diesem Programmierrätsel stehen wir vor der Herausforderung, einen String umzuwandeln, der maskierte Unicode-Zeichen enthält ( uXXXX) in eine Zeichenfolge aus tatsächlichen Unicode-Buchstaben.
Um das Problem zu veranschaulichen, betrachten Sie die Zeichenfolge „u0048u0065u006Cu006Cu006F Welt“. Normalerweise würde diese Zeichenfolge beim Drucken als „Hello World“ angezeigt. Allerdings tritt das Problem beim Auslesen von Dateinamen aus einer Datei auf. Dateinamen, die mit maskierter Unicode-Codierung gespeichert sind, werden bei Suchvorgängen möglicherweise nicht erkannt.
Um dieses Problem zu lösen, können wir auf die Apache Commons Lang-Bibliothek zurückgreifen. Seine StringEscapeUtils stellen eine Methode namens unescapeJava() bereit, die Unicode-codierte Zeichenfolgen effektiv in ihre jeweiligen Buchstabendarstellungen dekodieren kann.
Lösung:
import org.apache.commons.lang.StringEscapeUtils; @Test public void testUnescapeJava() { String sJava="\u0048\u0065\u006C\u006C\u006F"; System.out.println("StringEscapeUtils.unescapeJava(sJava):\n" + StringEscapeUtils.unescapeJava(sJava)); }
Ausgabe:
StringEscapeUtils.unescapeJava(sJava): Hello
Durch die Verwendung der StringEscapeUtils-Klasse, Wir können die Unicode-codierte Zeichenfolge erfolgreich in eine Zeichenfolge aus regulären Unicode-Buchstaben umwandeln und so effiziente Suchvorgänge nach Dateinamen ermöglichen.
Das obige ist der detaillierte Inhalt vonWie konvertiere ich maskierte Unicode-Zeichenfolgen in reguläre Unicode-Zeichen in Java?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!