Correspondance de caractères non-ASCII avec des expressions régulières dans JavaScript/jQuery
La correspondance de caractères non-ASCII dans une expression régulière peut être essentielle pour la gestion chaînes ou données internationalisées pouvant contenir des caractères non anglais. En JavaScript/jQuery, les approches suivantes peuvent être utilisées :
Exclusion ASCII :
L'approche la plus simple consiste à exclure les caractères ASCII de la correspondance en utilisant la négation de la classe de caractères. syntaxe :
[^\x00-\x7F]+
Cette expression régulière correspond à un ou plusieurs caractères qui ne sont pas dans la plage de caractères ASCII (0-127).
Exclusion Unicode :
De même, vous pouvez exclure les caractères Unicode :
[^\u0000-\u007F]+
Cette expression régulière exclut tous les caractères Unicode dans la plage 0x0000 à 0x007F.
Correspondance de blocs Unicode :
Pour un contrôle plus précis, vous pouvez utiliser des blocs de caractères Unicode pour filtrer vos correspondances. Ces blocs représentent des groupes de caractères apparentés, tels que le cyrillique ou le hangul.
Utilisez un outil tel que [UTF-8 Regex Checker](https://rishida.net/tools/regex/) pour trouver le bloc Unicode des personnages que vous devez faire correspondre. Par exemple, pour faire correspondre des caractères cyrilliques :
[\p{Cyrillic}]+
Gestion de mots individuels :
Pour faire correspondre des mots individuels pouvant contenir des caractères non-ASCII, vous pouvez combiner ces techniques avec des ancres de limite de mots :
\b[^\x00-\x7F]+\b
Cette expression régulière correspond aux mots qui ne sont pas entourés de caractères ASCII.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!