ホームページ > バックエンド開発 > C++ > ペルシア語文字のみを検証するための信頼できる正規表現を作成するにはどうすればよいですか?

ペルシア語文字のみを検証するための信頼できる正規表現を作成するにはどうすればよいですか?

Barbara Streisand
リリース: 2025-01-03 21:09:43
オリジナル
661 人が閲覧しました

How to Create a Reliable Regex for Validating Persian Characters Only?

ペルシア語文字のみを受け入れる正規表現

カスタム フォーム バリデーターがペルシア語文字のみを必要とするシナリオでは、最初は次のコードが有望に見えました:

var myregex = new Regex(@"^[\u0600-\u06FF]+$");
if (myregex.IsMatch(mytextBox.Text))
{
    args.IsValid = true;
}
else
{
    args.IsValid = false;
}
ログイン後にコピー

ただし、特定のペルシア語文字 (گ、چ、پ、ژ) は検出できませんでした。この記事では、この問題を詳しく掘り下げ、解決策を示します。

間違った仮定

[u0600-u06FF] と [آ-ی] は、ペルシア語の文字範囲が正しくありません。

  • [u0600-u06FF] には、アラビア数字を含む 209 個の不要な文字が含まれています。
  • [آ-ی] には 117 文字が含まれます。余分な

正確な文字範囲

正確さを確保するには、次の範囲にする必要があります。使用:

  • 文字:

    • ^[آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی] $
    • ^[u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u063Au0641u0642u06A9u06AFu0644-u0648u06CC] $
  • 数値:

    • ^[۰۱۲۳۴۵۶۷۸۹] $
    • ^[u06F0-u06F9] $
  • 母音:

    • [ ٌ ًّ َ ِ ُ ْ ]
    • [u202Cu064Bu064Cu064E-u0652]

結論

正しい文字範囲を利用することで、無効なペルシア語文字を拒否できます。さらに、ペルシア語はアラビア語で使用される発音記号をサポートしていますが、検証中にそれらを含めるかどうかはオプションです。

以上がペルシア語文字のみを検証するための信頼できる正規表現を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート