Suppression efficace des caractères non-ASCII dans les chaînes C#
Le nettoyage des données nécessite souvent de supprimer les caractères non-ASCII des chaînes. La méthode Regex.Replace
de C# fournit une solution concise pour cette tâche courante.
Exemple :
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
Répartition de l'expression régulière :
L'expression régulière [^u0000-u007F]
cible et supprime tous les caractères en dehors de la plage ASCII. Décomposons-le :
[^...]
: Il s'agit d'une classe de caractères niée. Il correspond à n'importe quel caractère non dans l'ensemble spécifié.u0000-u007F
: Ceci définit la plage de caractères ASCII (code Unicode points 0 à 127).
: Ce quantificateur garantit qu'un ou plusieurs caractères non-ASCII consécutifs correspondent et sont remplacés.Le remplacement des caractères correspondants par une chaîne vide (""
) les supprime efficacement de la chaîne d'origine. Cette approche offre un moyen propre et efficace de gérer la suppression des caractères non-ASCII en C#.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!