首頁 > 後端開發 > C++ > 如何建立正規表示式來僅驗證波斯字元?

如何建立正規表示式來僅驗證波斯字元?

Susan Sarandon
發布: 2025-01-02 17:03:39
原創
240 人瀏覽過

How to Create a Regex to Validate Only Persian Characters?

僅接受波斯語字符的正則表達式

驗證輸入以確保其僅包含波斯語字符有時可能具有挑戰性。雖然一系列程式碼點可能看起來是合適的解決方案,但它可能會無意中包含不需要的字元。

阿拉伯語 (0600–06FF) 和波斯語 (PE)(0622–062F、0631–064A)的 Unicode 字元集塊、064C–065F、0670–067F、0680–0683、 0685–0687、0691–069A、069C–069E)略有不同。通常建議的正規表示式 [u0600-u06FF] 涵蓋了所有阿拉伯字符,包括數字和一些波斯語中未使用的字符。

解決方案

僅準確檢測波斯語字符,考慮以下字符集合:

  • 字母: ^ [?????? $
  • 數字: ^[012334567789] $
  • 元音: [ ٌ ًّ َ ِ ُ ْ ]

根據需求組合這些集合以符合特定要求。此外,您可能希望在字元集中包含阿拉伯語 Hamza (∡)。

避免

避免使用 [u0600-u06FF] 或 [∢-Ì],因為它們分別包含波斯語中未使用的字符或多餘的字符。

以上是如何建立正規表示式來僅驗證波斯字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板