> 백엔드 개발 > C++ > 정규식을 사용하여 페르시아어 문자를 정확하게 확인하는 방법은 무엇입니까?

정규식을 사용하여 페르시아어 문자를 정확하게 확인하는 방법은 무엇입니까?

Linda Hamilton
풀어 주다: 2025-01-03 01:24:39
원래의
493명이 탐색했습니다.

How to Accurately Validate Persian Characters Using Regular Expressions?

정규 표현식을 사용하여 페르시아어 문자 유효성 검사

양식 유효성 검사의 맥락에서 페르시아어 문자만 허용되는지 확인하는 것은 어려울 수 있습니다. 이 문제를 해결하기 위해 일반적인 접근 방식은 정규 표현식(regex)을 사용하는 것입니다.

그러나 정규 표현식 ^[u0600-u06FF] $는 아랍어 문자도 포함하므로 종종 부족합니다. 페르시아어 문자를 정확하게 확인하려면 수정된 정규식이 필요합니다.

업데이트된 정규식

페르시아어 문자를 정확하게 승인하려면 업데이트된 정규식을 고려하세요.

^[\u0622\u0627\u0628\u067E\u062A-\u062C\u0686\u062D-\u063A\u0641\u0642\u06A9\u06AF\u0644-\u0648\u06CC]+$
로그인 후 복사

이 표현식은 다음 문자 범위와 일치합니다.

  • 문자: [آابپتثجچحجچجژسژسصدیظعبپتثابپتظعبقککگلمنوهی]
  • 숫자: [Ұٱپتثجچحاتاتاجچحاتاتاتابپتثابپتثجچحاتاجچجچجچاگلمنوهی]
  • 숫자: [Ұڱڲڳٴڵڶٷٸٹ]
모음: [ ٌ ًّ َ ِ ُ ْ ]

^[آ-ی]+$
로그인 후 복사
또는 정규 표현식 특성에 따라 정규 표현식을 단순화하고 모든 문자를 한 번에 포함할 수 있습니다. 예를 들면 다음과 같습니다.

확장 정규 표현식이 필요한 이유 올바르지 않음

    이전에 사용된 정규식 ^[u0600-u06FF] $는 다음을 포함하므로 부적절합니다.
  • 페르시아 문자에 필요한 42자 세트 외에 209개의 추가 문자
고유한 페르시아어 대신 아라비아 숫자

추가 고려 사항

포괄적인 유효성 검사를 위해 문자 집합에 Hamza(τ)와 같은 추가 문자를 포함하는 것을 고려하세요. 또한 필요한 경우 숫자에 대해 별도의 정규식을 사용하여 다양한 숫자 시스템을 수용합니다.

위 내용은 정규식을 사용하여 페르시아어 문자를 정확하게 확인하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿