> 백엔드 개발 > C++ > 페르시아어 문자만 검증하기 위한 신뢰할 수 있는 정규식을 만드는 방법은 무엇입니까?

페르시아어 문자만 검증하기 위한 신뢰할 수 있는 정규식을 만드는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2025-01-03 21:09:43
원래의
593명이 탐색했습니다.

How to Create a Reliable Regex for Validating Persian Characters Only?

페르시아어 문자만 허용하는 정규식

사용자 정의 양식 검사기에 페르시아어 문자만 필요한 시나리오에서 처음에는 다음 코드가 유망한 것으로 나타났습니다.

var myregex = new Regex(@"^[\u0600-\u06FF]+$");
if (myregex.IsMatch(mytextBox.Text))
{
    args.IsValid = true;
}
else
{
    args.IsValid = false;
}
로그인 후 복사

그러나 특정 페르시아어 문자(گ, چ, پ, ژ)는 감지하지 못했습니다. 이 문서에서는 문제를 자세히 살펴보고 해결책을 제공합니다.

잘못된 가정

[u0600-u06FF] 및 [آ-ی]은 페르시아어의 잘못된 문자 범위입니다. 유효성 검사.

  • [u0600-u06FF]에는 아라비아 숫자를 포함하여 209개의 불필요한 문자가 포함됩니다.
  • [آ-ی]에는 117개가 포함됩니다. 추가 문자.

정확한 문자 범위

정확성을 보장하려면 다음 범위를 사용해야 합니다. 사용된 문자:

  • 문자:

    • ^[آابپتثجچحدىرجژسصصىظعىحدىرییاتظعتىحدىرجاگاناگاگلمنوهی] $
    • ^[u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u063Au0641u0642u06A9u06AFu0644-u0648u06CC] $
  • 숫자:

    • ^[Ұڱڲڳവڵڷٸٹ] $
    • ^[u06F0-u06F9] $
  • 모음:

    • [ ٌ ًّ َ ِ ُ ْ ]
    • [u202Cu064Bu064Cu064E-u0652]

결론

올바른 문자 범위를 활용하면 잘못된 페르시아어 문자를 거부할 수 있습니다. 또한 Farsi는 아랍어에 사용되는 분음 부호를 지원하지만 유효성 검사 중에 포함 여부는 선택 사항입니다.

위 내용은 페르시아어 문자만 검증하기 위한 신뢰할 수 있는 정규식을 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿