Suppression des signes diacritiques dans Go à l'aide des bibliothèques de normalisation de texte
Comment pouvez-vous supprimer sans effort les signes diacritiques des chaînes codées en UTF8 dans Go ? Par exemple, transformez la chaîne "žůžo" en "zuzo".
Solution :
Heureusement, Go propose une gamme de bibliothèques standards qui gèrent la normalisation du texte, notamment Unicode normalisation et suppression des signes diacritiques. Voici comment vous pouvez les utiliser efficacement :
package main import ( "fmt" "unicode" "golang.org/x/text/transform" "golang.org/x/text/unicode/norm" ) func isMn(r rune) bool { return unicode.Is(unicode.Mn, r) // Mn: nonspacing marks } func main() { t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC) result, _, _ := transform.String(t, "žůžo") fmt.Println(result) }
Ce code utilise une série de transformations utilisant les algorithmes NFD (Formulaire de normalisation D), de suppression de Mn et NFC (Formulaire de normalisation C). Le résultat supprime efficacement tous les signes diacritiques de la chaîne d'entrée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!