Maison > développement back-end > Golang > Comment supprimer efficacement les signes diacritiques des chaînes UTF-8 dans Go ?

Comment supprimer efficacement les signes diacritiques des chaînes UTF-8 dans Go ?

Susan Sarandon
Libérer: 2024-12-08 14:03:11
original
545 Les gens l'ont consulté

How to Efficiently Remove Diacritics from UTF-8 Strings in Go?

Suppression des signes diacritiques dans Go

Lorsque vous travaillez avec des chaînes codées en UTF8, il peut être nécessaire de supprimer les signes diacritiques, tels que les accents de "žůžo " pour obtenir "zuzo". Pour gérer efficacement de tels scénarios, des bibliothèques et des techniques standard sont disponibles dans Go.

Une approche consiste à exploiter la fonction unicode.Is() pour identifier les signes diacritiques (caractères classés comme « Mn » pour les marques sans espacement).

L'extrait de code suivant montre comment supprimer les signes diacritiques d'une chaîne donnée en utilisant Unicode/norm et golang.org/x/text/transform packages :

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r) // Mn: nonspacing marks
}

func main() {
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)
    result, _, _ := transform.String(t, "žůžo")
    fmt.Println(result)
}
Copier après la connexion

Ce code supprime les signes diacritiques en appliquant une série de transformations :

  1. Décomposition de forme normalisée (NFD) : décompose la chaîne en ses Caractères Unicode de base, y compris signes diacritiques.
  2. RemoveFunc(isMn) : filtre les caractères qui ne sont pas des signes d'espacement (diacritiques).
  3. Composition du formulaire de normalisation (NFC) : recompose la chaîne sans signes diacritiques.

En tant que Résultat, le résultat sera une chaîne dépourvue de signes diacritiques, comme dans l'exemple : "žůžo" => "zuzo".

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal