Rumah > Java > javaTutorial > teks badan

Bagaimanakah Anda Boleh Mengalih Keluar Tanda Aksen dan Menukar Simbol kepada Abjad Inggeris di Jawa?

DDD
Lepaskan: 2024-11-11 03:29:02
asal
675 orang telah melayarinya

How Can You Remove Accent Marks and Convert Symbols to the English Alphabet in Java?

Menukar Simbol dan Huruf Aksen kepada Abjad Inggeris di Jawa

Dalam alam Unicode, di mana terdapat segudang aksara, simbol dan huruf beraksen tertentu mempunyai persamaan yang ketara kepada rakan abjad Inggeris mereka. Untuk memudahkan pemprosesan teks, pembangun sering mencari cara untuk menukar aksara ini kepada abjad 26 huruf yang biasa.

Penukaran ini menimbulkan cabaran yang ketara disebabkan oleh bilangan aksara Unicode yang banyak dan variasi halus dalam huruf individu. Sebagai contoh, huruf "A" sahaja mempunyai lebih daripada 20 perwakilan unikod. Mengelaskan dan memetakan aksara ini dengan tepat boleh kelihatan menakutkan.

Java Solution for Accent Removal

Untuk tugas khusus mengalih keluar tanda diakritik (aksen) daripada teks dalam Java, kaedah berikut telah terbukti berkesan:

import java.text.Normalizer;
import java.util.regex.Pattern;

public String deAccent(String str) {
    String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); 
    Pattern pattern = Pattern.compile("\p{InCombiningDiacriticalMarks}+");
    return pattern.matcher(nfdNormalizedString).replaceAll("");
}
Salin selepas log masuk

Kaedah ini memanfaatkan kelas Normalizer untuk menukar aksara Unicode ke dalam "bentuk ternormal", dikenali sebagai NFD, yang memisahkan aksara asas daripada tanda aksen. Selepas itu, ungkapan biasa digunakan untuk mengalih keluar sebarang tanda diakritik yang tinggal daripada rentetan ternormal NFD.

Dengan menggunakan pendekatan ini, anda boleh menukar simbol dan huruf beraksen secara berkesan kepada setara abjad Inggerisnya, membolehkan pemprosesan teks diperkemas dan manipulasi data yang lebih bersih.

Atas ialah kandungan terperinci Bagaimanakah Anda Boleh Mengalih Keluar Tanda Aksen dan Menukar Simbol kepada Abjad Inggeris di Jawa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan