Javascript RegExp: Word Boundaries and Unicode Characters
Apabila menggunakan RegExp Javascript untuk autolengkap, pengendalian aksara khas dalam bahasa seperti Finland menjadi penting. Pendekatan tradisional memadankan sempadan perkataan (b) gagal mengendalikan aksara seperti ä, ö dan å.
Penyelesaian: Kod Unikod
Untuk menyelesaikan isu ini, kami boleh memanfaatkan kod Unicode untuk aksara khas ini:
[\u00C4,\u00E4,\u00C5,\u00E5,\u00D6,\u00F6] => äÄåÅöÖ
Kumpulan Bukan Tangkap
Daripada b, kita boleh menggunakan kumpulan bukan tangkap untuk memadankan permulaan daripada rentetan atau ruang putih. Pendekatan ini membolehkan kami memadankan aksara khas dengan lebih berkesan:
<code class="javascript">var pattern = "(?:^|\s)" + searchterm;</code>
Pecahan:
Contoh:
<code class="javascript">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö"; var searchterm = "äl"; if (new RegExp(pattern, "gi").test(title)) { // Match found }</code>
Atas ialah kandungan terperinci Berikut ialah beberapa pilihan tajuk, dengan mengingati format \'soal jawab\' yang anda minta: * Bagaimana untuk Memadankan Sempadan Perkataan dengan Aksara Khas dalam RegExp JavaScript? * Autolengkap. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!