Penyahtulisan Aksara dalam PHP
Dalam PHP, mengekstrak aksara asas daripada rakan beraksennya boleh dicapai menggunakan pelbagai kaedah. Satu pendekatan melibatkan penggunaan kelas Normalizer, yang menawarkan keupayaan normalisasi aksara asli. Malangnya, kelas Normalizer mungkin tidak tersedia dalam versi PHP lama atau pada platform pengehosan tertentu.
Kaedah alternatif melibatkan penggunaan ungkapan biasa dan penggantian aksara. Fungsi berikut, yang dikenali sebagai Unaccent, secara berkesan mengalih keluar tanda aksen biasa daripada rentetan:
<code class="php">function Unaccent($string) { return preg_replace('~&([a-z]{1,2})(acute|cedil|circ|grave|lig|orn|ring|slash|th|tilde|uml);~i', '', htmlentities($string, ENT_QUOTES, 'UTF-8')); }</code>
Fungsi ini mula-mula menukar aksara beraksen ke dalam entiti HTML mereka menggunakan htmlentities. Ia kemudian menggunakan ungkapan biasa yang mengenal pasti dan menangkap aksara beraksen, termasuk tanda aksen. Pemegang tempat $1 dalam corak gantian memastikan bahawa hanya aksara asas dikekalkan.
Sebagai contoh, menggunakan fungsi ini pada "ã" dan "é" masing-masing akan menghasilkan "a" dan "e".
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengalih Keluar Aksen daripada Aksara dalam PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!