Membetulkan Aksara UTF-8 Patah dengan file_get_contents()
Apabila mendapatkan semula kandungan HTML daripada sumber luaran menggunakan file_get_contents(), perkara biasa ditemui isu dengan aksara UTF-8 terputus. Ini boleh menyebabkan aksara yang tidak masuk akal dipaparkan dan bukannya aksara berbilang bahasa yang dimaksudkan.
Penyelesaian: Penukaran Pengekodan dengan mb_convert_encoding()
Satu penyelesaian yang berkesan ialah menggunakan mb_convert_encoding( ) berfungsi untuk menukar kandungan HTML yang diambil kepada pengekodan UTF-8 secara eksplisit. Barisan kod berikut mempamerkan pendekatan ini:
$html = mb_convert_encoding(file_get_contents('http://example.com'), 'UTF-8', 'auto');
Dengan menggunakan parameter "auto" dalam fungsi mb_detect_encoding(), pengekodan aksara yang betul bagi kandungan HTML boleh dikesan secara automatik. Ini memastikan kandungan yang diambil ditukar dengan betul kepada UTF-8, menyelesaikan isu perebutan aksara.
Pertimbangan Tambahan:
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membetulkan Aksara UTF-8 yang Patah Apabila Menggunakan file_get_contents()?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!