Fail HTML bercelaru adalah masalah yang sangat biasa, terutamanya apabila menukar antara fail dengan pengekodan yang berbeza. Artikel ini akan memperkenalkan sebab mengapa fail HTML bercelaru dan cara menyelesaikan masalah ini.
Pertama, mari kita fahami apa itu pengekodan fail. Setiap format fail mempunyai pengekodan sendiri yang digunakan untuk menukar aksara dalam fail teks kepada aliran bit yang boleh dikenali dan diproses oleh komputer. Kaedah pengekodan fail teks yang biasa digunakan pada masa ini termasuk ASCII, UTF-8, UTF-16, dll. Terdapat juga pelbagai kaedah pengekodan khusus di negara dan wilayah yang berbeza, seperti GBK, BIG5, dsb.
Apabila kami membuka fail HTML yang sama menggunakan kaedah pengekodan yang berbeza, aksara bercelaru akan muncul. Berikut ialah beberapa situasi di mana aksara bercelaru sering muncul:
Jika kami membuka fail menggunakan kaedah pengekodan yang salah, aksara tersebut dalam teks akan dipaparkan sebagai aksara bercelaru. Contohnya, jika anda membuka fail yang dikodkan UTF-8 dengan pengekodan GBK, aksara yang bercelaru akan muncul. Oleh kerana UTF-8 dan GBK mempunyai kaedah pengekodan yang berbeza, mereka akan menggunakan kaedah pengekodan yang berbeza untuk aksara yang sama, menghasilkan aksara output yang berbeza.
Kaedah pengekodan fail hendaklah disenaraikan dalam pengepala fail HTML. Jika tidak dinyatakan, penyemak imbas akan cuba menggunakan pengekodan lalai untuk menghuraikan fail. Jika kaedah pengekodan lalai berbeza daripada kaedah pengekodan sebenar fail, aksara bercelaru akan muncul.
Semua fail teks yang dipindahkan antara pelayan web dan penyemak imbas perlu menentukan pengekodan yang betul. Jika pelayan tidak menetapkan kaedah pengekodan dengan betul, penyemak imbas akan menggunakan kaedah pengekodan lalai untuk menghurai, yang juga akan menyebabkan aksara bercelaru.
Terdapat beberapa cara untuk menyelesaikan masalah fail bercelaru:
Tambahkan kod berikut pada kepala Fail HTML:
<meta charset="UTF-8">
Antaranya, "UTF-8" bermaksud menentukan untuk menggunakan pengekodan UTF-8 untuk menghuraikan fail. Jika fail menggunakan kaedah pengekodan lain, anda perlu menggantikan "UTF-8" dengan kaedah pengekodan yang sebenarnya digunakan oleh fail.
Terdapat beberapa alat penukaran pengekodan profesional yang boleh menukar fail daripada satu pengekodan kepada pengekodan yang lain. Alat yang biasa digunakan termasuk editor Sublime Text, editor Notepad++, dsb. Dalam editor ini, pilihan seperti Pengekodan -> Tukar kepada UTF-8 atau Tukar kepada GBK boleh dipilih daripada menu.
Jika pelayan web tidak menetapkan kaedah pengekodan dengan betul dan menyebabkan aksara bercelaru, anda boleh menambah kod berikut pada fail konfigurasi pelayan:
AddDefaultCharset utf-8
Antaranya, “utf-8” bermaksud menggunakan pengekodan UTF-8 untuk menghantar semua fail teks. Jika pelayan menggunakan kaedah pengekodan lain, anda perlu menggantikan "utf-8" dengan kaedah pengekodan yang sebenarnya digunakan oleh pelayan.
Ringkasnya, masalah fail HTML yang bercelaru biasanya disebabkan oleh kaedah pengekodan yang berbeza. Apabila menyelesaikan fail bercelaru, kita perlu memilih penyelesaian yang sepadan berdasarkan punca masalah. Kadangkala ia hanya perlu menambah baris kod pada kepala fail HTML, dan kadangkala perlu menggunakan alat penukaran pengekodan profesional atau mengubah suai tetapan pelayan. Saya harap artikel ini dapat membantu semua orang lebih memahami dan menyelesaikan masalah fail HTML yang bercelaru.
Atas ialah kandungan terperinci fail html bercelaru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!