PHP ialah bahasa skrip sebelah pelayan yang sangat popular, tetapi ramai pemula sering menghadapi masalah aksara Cina yang bercelaru. Masalah ini sebahagian besarnya disebabkan oleh tetapan pengekodan lalai yang salah. Dalam artikel ini, kita akan membincangkan mengapa pengekodan lalai adalah sangat penting untuk menulis halaman web Cina dalam PHP, dan juga meneroka cara PHP menetapkan pengekodan.
Apabila PHP mula dijalankan, ia tidak mengetahui jenis pengekodan fail halaman web. Oleh itu, jika anda menggunakan aksara Cina dalam skrip PHP atau membaca halaman web Cina, PHP akan cuba meneka jenis pengekodan lalai. Jika jenis pengekodan yang diteka oleh PHP tidak sepadan dengan jenis pengekodan sebenar, maka masalah aksara Cina yang bercelaru akan berlaku.
Sebagai contoh, jika anda menggunakan jenis pengekodan UTF-8 dan PHP meneka bahawa fail itu dikodkan GBK, PHP akan menganggap aksara Cina yang dikodkan UTF-8 sebagai aksara yang dikodkan GBK, mengakibatkan aksara yang bercelaru. Dalam kes ini, walaupun menggunakan pengekodan aksara yang betul tidak akan menyelesaikan masalah kerana PHP tidak dapat meneka ketepatan jenis pengekodan aksara.
Dalam PHP, anda boleh menetapkan pengekodan aksara dalam tiga cara:
1) Dengan menetapkannya dalam teg pada halaman web:
< html>
Ini ialah kandungan Cina.