正規表示式中 Java 的 \w 和 \b 的 Unicode 等效項是什麼？-java教程-PHP中文網

首頁

Java

java教程

正規表示式中 Java 的 \w 和 \b 的 Unicode 等效項是什麼？

DDD

Dec 13, 2024 pm 02:55 PM

What are the Unicode-aware equivalents for Java's w and b in regular expressions?

Java 正規表示式中 w 和 b 的 Unicode 等效項？

與其他表達式相比，Java 正規表示式的字元類別簡寫（w 和 b）有限現代正規表示式實作。在Java中，w僅匹配[A-Za-z0-9_]，限制了單字匹配能力。此外，b 的字邊界語意偏離了 w 和 Unicode 的定義。

Unicode 感知等效項

幸運的是，已經開發了自訂 Unicode 感知等效項來克服這些限制。以下是替換內容：

\s: [\u0009-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000]
\S: [^\u0009-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000]

\v: [\u000A-\u000D\u0085\u2028\u2029]
\V: [^\u000A-\u000D\u0085\u2028\u2029]

\h: [\u0009\u0020\u00A0\u1680\u180E\u2000-\u200A\u202F\u205F\u3000]
\H: [^\u0009\u0020\u00A0\u1680\u180E\u2000-\u200A\u202F\u205F\u3000]

\w: [\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]]
\W: [^\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]]

\b: (?:(?<=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]])(?![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]])|(?<![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]])(?=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]]))
\B: (?:(?<=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]])(?=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]])|(?<![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]])(?![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&amp;&amp;\p{So}]]))

\d: \p{Nd}
\D: \P{Nd}

\R: (?:(?>\u000D\u000A)|[\u000A\u000B\u000C\u000D\u0085\u2028\u2029])
\X: (?>\PM\pM*)

登入後複製

理解邊界（b 和 B）

邊界匹配單字字元轉換為非單字字元的位置，反之亦然。邊界定義為：

IF follows word
THEN doesn't precede word
ELSIF doesn't follow word
THEN does precede word

登入後複製

轉換為正規表示式語法：

(?:(?<=\w)(?!\w)|(?<!\w)(?=\w))

登入後複製

同樣，非邊界(B) 等效項為：

(?:(?<=\w)(?=\w)|(?<!\w)(?!\w))

登入後複製

在Java 中加入Unicode 支援

至將這些Unicode等效項合併到 Java 正規表示式中，您可以在編譯之前使用字串重寫函數來轉換模式。以下是使用名為 rewrite 的自訂函數的範例：

String rewrittenPattern = rewrite(originalPattern);
Pattern compiledPattern = Pattern.compile(rewrittenPattern);

登入後複製

以上是正規表示式中 Java 的 \w 和 \b 的 Unicode 等效項是什麼？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1677

CakePHP 教程

1431

Laravel 教程

1334

PHP教程

1280

C# 教程

1257

Related knowledge

公司安全軟件導致應用無法運行？如何排查和解決？ Apr 19, 2025 pm 04:51 PM

公司安全軟件導致部分應用無法正常運行的排查與解決方法許多公司為了保障內部網絡安全，會部署安全軟件。 ...

如何將姓名轉換為數字以實現排序並保持群組中的一致性？ Apr 19, 2025 pm 11:30 PM

將姓名轉換為數字以實現排序的解決方案在許多應用場景中，用戶可能需要在群組中進行排序，尤其是在一個用...

如何使用MapStruct簡化系統對接中的字段映射問題？ Apr 19, 2025 pm 06:21 PM

系統對接中的字段映射處理在進行系統對接時，常常會遇到一個棘手的問題：如何將A系統的接口字段有效地映�...

如何優雅地獲取實體類變量名構建數據庫查詢條件？ Apr 19, 2025 pm 11:42 PM

在使用MyBatis-Plus或其他ORM框架進行數據庫操作時，經常需要根據實體類的屬性名構造查詢條件。如果每次都手動...

IntelliJ IDEA是如何在不輸出日誌的情況下識別Spring Boot項目的端口號的？ Apr 19, 2025 pm 11:45 PM

在使用IntelliJIDEAUltimate版本啟動Spring...

Java對像如何安全地轉換為數組？ Apr 19, 2025 pm 11:33 PM

Java對象與數組的轉換：深入探討強制類型轉換的風險與正確方法很多Java初學者會遇到將一個對象轉換成數組的�...

電商平台SKU和SPU數據庫設計：如何兼顧用戶自定義屬性和無屬性商品？ Apr 19, 2025 pm 11:27 PM

電商平台SKU和SPU表設計詳解本文將探討電商平台中SKU和SPU的數據庫設計問題，特別是如何處理用戶自定義銷售屬...

如何利用Redis緩存方案高效實現產品排行榜列表的需求？ Apr 19, 2025 pm 11:36 PM

Redis緩存方案如何實現產品排行榜列表的需求？在開發過程中，我們常常需要處理排行榜的需求，例如展示一個�...

See all articles

正規表示式中 Java 的 \w 和 \b 的 Unicode 等效項是什麼？

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題