如何在 Java 中刪除重音符號並將符號轉換為英文字母？-java教程-PHP中文網

如何在 Java 中刪除重音符號並將符號轉換為英文字母？

DDD

發布： 2024-11-11 03:29:02

原創

797 人瀏覽過

How Can You Remove Accent Marks and Convert Symbols to the English Alphabet in Java?

將符號和重音字母轉換為Java 中的英文字母

在Unicode 領域，存在著無數的字符，某些符號和重音字母具有驚人的相似性對應的英文字母。為了簡化文字處理，開發人員經常尋求將這些字元轉換為熟悉的 26 個字母字母表的方法。

由於 Unicode 字元數量龐大以及各個字母之間的細微變化，這種轉換帶來了巨大的挑戰。例如，光是字母「A」就有 20 多種 unicode 表示形式。準確地對這些字符進行分類和映射似乎令人畏懼。

用於去除重音符號的Java 解決方案

對於從Java 文本中刪除變音符號（重音符號）的特定任務，以下方法已被證明是有效的：

import java.text.Normalizer;
import java.util.regex.Pattern;

public String deAccent(String str) {
    String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); 
    Pattern pattern = Pattern.compile("\p{InCombiningDiacriticalMarks}+");
    return pattern.matcher(nfdNormalizedString).replaceAll("");
}

登入後複製

此方法利用Normalizer 類別將Unicode 字元轉換為其“標準化形式”，稱為NFD，它將基本字元與重音符號分開。隨後，使用正規表示式從 NFD 標準化字串中刪除任何剩餘的變音符號。

透過利用這種方法，您可以有效地將符號和重音字母轉換為其等效的英文字母，從而實現簡化的文字處理和更乾淨的資料操作。

以上是如何在 Java 中刪除重音符號並將符號轉換為英文字母？的詳細內容。更多資訊請關注PHP中文網其他相關文章！