オンライン フォーム検証では、多くの場合、ユーザー入力を特定の文字セットに制限する必要があります。ペルシア語のテキストを扱う場合、他のすべての文字を除外し、ペルシア語の文字のみを確実に受け入れることが一般的な課題となります。
ペルシア語を検証するいくつかの試み正規表現を使用する文字は、コードポイント範囲 u0600 ~ u06FF に依存します。ただし、この範囲にはアラビア文字も含まれるため、誤検知が発生します。同様に、文字範囲 [آ-ی] のみに依存すると、すべてのペルシア語文字を考慮することができません。
検証用の正しい文字セットペルシア文字には、以下:
の代わりに、次のコードポイントを使用できますコードポイント表記をサポートする正規表現の範囲:
必須のペルシア語文字が含まれているにもかかわらず、u0600-u06FF と [آ-ی] は両方とも不正確で非効率的です。 u0600 ~ u06FF には、アラビア語の拡張文字、発音記号、句読点など、無関係な文字が多数含まれています。 [آ-ی] には、必要なペルシア語アルファベットを超える文字も含まれています。
正しい文字セットを使用すると、承認されたペルシャ語文字のみがフォーム フィールドで許可されるようになり、データの精度と一貫性が向上します。
以上がオンラインフォームでペルシア語文字のみを検証するための正規表現を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。