ホームページ > バックエンド開発 > C++ > オンラインフォームでペルシア語文字のみを検証するための正規表現を作成するにはどうすればよいですか?

オンラインフォームでペルシア語文字のみを検証するための正規表現を作成するにはどうすればよいですか?

Linda Hamilton
リリース: 2025-01-01 00:39:09
オリジナル
324 人が閲覧しました

How to Create a Regex for Validating Only Persian Characters in Online Forms?

ペルシア語文字のみを受け入れる正規表現

オンライン フォーム検証では、多くの場合、ユーザー入力を特定の文字セットに制限する必要があります。ペルシア語のテキストを扱う場合、他のすべての文字を除外し、ペルシア語の文字のみを確実に受け入れることが一般的な課題となります。

gt;一般的な間違ったアプローチ

ペルシア語を検証するいくつかの試み正規表現を使用する文字は、コードポイント範囲 u0600 ~ u06FF に依存します。ただし、この範囲にはアラビア文字も含まれるため、誤検知が発生します。同様に、文字範囲 [آ-ی] のみに依存すると、すべてのペルシア語文字を考慮することができません。

正しい解決策

検証用の正しい文字セットペルシア文字には、以下:

  • 文字: [آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی]
  • 数字(ペルシア語数字): [۰۱۲۳۴۵۶۷۸۹]
  • 母音: [ ٌ ًّ َ ِ ُ ْ ]

の代わりに、次のコードポイントを使用できますコードポイント表記をサポートする正規表現の範囲:

  • 文字: [u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u 063Au0641u0642u06A9u06AFu0644-u0648u06CC]
  • 番号: [u06F0-u06F9]
  • 母音: [u202Cu064Bu064Cu064E-u0652]

なぜ u0600-u06FF と[آ-ی]?

必須のペルシア語文字が含まれているにもかかわらず、u0600-u06FF と [آ-ی] は両方とも不正確で非効率的です。 u0600 ~ u06FF には、アラビア語の拡張文字、発音記号、句読点など、無関係な文字が多数含まれています。 [آ-ی] には、必要なペルシア語アルファベットを超える文字も含まれています。

正しい文字セットを使用すると、承認されたペルシャ語文字のみがフォーム フィールドで許可されるようになり、データの精度と一貫性が向上します。

以上がオンラインフォームでペルシア語文字のみを検証するための正規表現を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート