Maison > développement back-end > C++ > Comment créer une expression régulière pour valider uniquement les caractères persans dans les formulaires en ligne ?

Comment créer une expression régulière pour valider uniquement les caractères persans dans les formulaires en ligne ?

Linda Hamilton
Libérer: 2025-01-01 00:39:09
original
323 Les gens l'ont consulté

How to Create a Regex for Validating Only Persian Characters in Online Forms?

Regex pour accepter uniquement les caractères persans

Dans la validation de formulaires en ligne, il est souvent nécessaire de restreindre la saisie de l'utilisateur à des jeux de caractères spécifiques. Lorsqu'il s'agit de texte persan, un défi courant consiste à garantir que seuls les caractères persans sont acceptés, à l'exclusion de tous les autres.

Approches incorrectes courantes

Quelques tentatives de validation du persan les caractères utilisant des expressions régulières reposent sur la plage de points de code u0600-u06FF. Cependant, cette plage englobe également les caractères arabes, ce qui conduit à des faux positifs. De même, se fier uniquement à la plage de caractères [آ-ی] ne parvient pas non plus à prendre en compte tous les caractères persans.

Solution correcte

Le jeu de caractères correct pour valider Les caractères persans comprennent les éléments suivants :

  • Lettres : [آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی]
  • Nombres (chiffres persans) : [۰۱۲۳۴۵۶۷۸۹]
  • Voyelles : [ ٌ ًّ َ ِ ُ ْ ]

Vous pouvez également utiliser les plages de points de code suivantes pour les expressions régulières prenant en charge le point de code notations :

  • Lettres : [u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u 063Au0641u0642u06A9u06AFu0644-u0648u06CC]
  • Numéros : [u06F0-u06F9]
  • Voyelles : [u202Cu064Bu064Cu064E-u0652]

Pourquoi éviter u0600-u06FF et [آ-ی]?

Malgré l'inclusion des caractères persans requis, u0600-u06FF et [آ-ی] sont inexacts et inefficaces. u0600-u06FF comprend de nombreux caractères non pertinents, tels que des lettres arabes étendues, des signes diacritiques et des signes de ponctuation. [آ-ی] contient également des caractères au-delà de l'alphabet persan nécessaire.

En utilisant le jeu de caractères correct, vous pouvez vous assurer que seuls les caractères persans autorisés sont autorisés dans votre champ de formulaire, améliorant ainsi l'exactitude et la cohérence des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal