Dans la validation de formulaires en ligne, il est souvent nécessaire de restreindre la saisie de l'utilisateur à des jeux de caractères spécifiques. Lorsqu'il s'agit de texte persan, un défi courant consiste à garantir que seuls les caractères persans sont acceptés, à l'exclusion de tous les autres.
Quelques tentatives de validation du persan les caractères utilisant des expressions régulières reposent sur la plage de points de code u0600-u06FF. Cependant, cette plage englobe également les caractères arabes, ce qui conduit à des faux positifs. De même, se fier uniquement à la plage de caractères [آ-ی] ne parvient pas non plus à prendre en compte tous les caractères persans.
Le jeu de caractères correct pour valider Les caractères persans comprennent les éléments suivants :
Vous pouvez également utiliser les plages de points de code suivantes pour les expressions régulières prenant en charge le point de code notations :
Malgré l'inclusion des caractères persans requis, u0600-u06FF et [آ-ی] sont inexacts et inefficaces. u0600-u06FF comprend de nombreux caractères non pertinents, tels que des lettres arabes étendues, des signes diacritiques et des signes de ponctuation. [آ-ی] contient également des caractères au-delà de l'alphabet persan nécessaire.
En utilisant le jeu de caractères correct, vous pouvez vous assurer que seuls les caractères persans autorisés sont autorisés dans votre champ de formulaire, améliorant ainsi l'exactitude et la cohérence des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!