Menggantikan semua aksara aksen dalam rentetan dengan cekap?
Saya1 sedang mencari meningkatkan fungsi perbandingan rentetan dalam kelas JavaScript saya.
Pada masa ini mereka menggunakan string.replace() untuk melakukan carian global (g) dan menggantikan semua aksara beraksen dalam rentetan (p{InCombiningDiacriticalMarks} ) dengan bentuk asasnya (penguraian kanonik menggunakan NFD).
Mencari rentetan input untuk genap beberapa aksara beraksen menghasilkan churn yang cukup luas - dan apabila mencari input yang lebih besar, prestasi boleh menjadi lembap.
Adakah terdapat cara yang lebih berkesan untuk melakukannya?
[1] Edit - Menjelaskan isu umum.
Operasi ini sedang dilakukan untuk menukar aksara Jerman beraksen kepada bentuk tanpa aksen, supaya apabila menyusun rentetan dalam susunan "salah" (cth. umlaut berakhir sebelum bukan umlaut "a"), ia boleh diisih dengan betul mengikut jangkaan tempatan.
Oleh itu adalah tidak memadai untuk mencari aksara beraksen dan menggantikannya dengan setara tanpa aksen - adalah perlu untuk menggantikan bentuk beraksen dengan asas mereka setara.
Penormalan yang tidak atau salah boleh mengakibatkan tertib isihan yang salah.[Edit 2]
Untuk pelaksanaanberhampiran-pengumpulan-pengisihan yang betul pada bahagian klien Saya memerlukan fungsi JavaScript yang berfungsi cekap penggantian aksara tunggal dalam rentetan.
Inilah yang saya maksudkan (perhatikan bahawa ini terpakai pada teks Jerman, bahasa lain disusun secara berbeza):native sorting gets it wrong: a b c o u z ä ö ü collation-correct would be: a ä b c o ö u ü z
// s would be a rather short string (something like // 200 characters at max, most of the time much less) function makeSortString(s) { var translate = { "ä": "a", "ö": "o", "ü": "u", "Ä": "A", "Ö": "O", "Ü": "U" // probably more to come }; var translate_re = /[öäüÖÄÜ]/g; return ( s.replace(translate_re, function(match) { return translate[match]; }) ); }
Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Aksara Beraksen dengan Cekap dalam Rentetan JavaScript untuk Isih Yang Diperbaiki?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!