前言
相信很多人在使用PHP的過程中都遇到過產生檔案亂碼的情況,不論是使用fwrite還是file_put_contents寫入。也許你會先嘗試從編碼入手嘗試解決,但最終的結果往往是不理想的,儘管我們都將其轉換為了UTF-8編碼了...
那麼究其根本原因是什麼呢?
一句話:缺少頭BOM(當然,這裡指的肯定不是Js的Bom)
#BOM
既然提到了BOM,那麼可能有的同學不太了解這個傢伙,這裡我簡單說一下,老鳥可以跳過。在Windows下用記事本之類的程式將文字檔儲存為UTF-8格式時,記事本會在檔案頭前面加上幾個不可見的字元(EF BB BF),就是所謂的BOM(Byte order Mark )。
不僅限於 記事本保存的文件,只要在文件的開口包含了「EF BB BF」 幾個不可見的字元(十六進位應該是xEFxBBxBF,用二進位編輯檔案可見)。這像是約定俗成的東西,當系統看到這玩意的時候,就會覺得你這個檔案是UTF-8編碼的。
這就是為什麼當檔案沒有BOM時,你給使用者呈現的檔案就可能是亂碼的原因了。
PS : 其實你可以將BOM理解成HTML中的charset屬性和XML中的encoding屬性,就是扮演一個標識作用。
方案
那麼如何在PHP中輸出BOM呢?
答案是在所有內容輸出之前輸出:
print(chr(0xEF).chr(0xBB).chr(0xBF));
當然,如果你是在生成文件,可能是下面兩種:
fwrite($file, chr(0xEF).chr(0xBB).chr(0xBF)); file_put_contents($file, chr(0xEF).chr(0xBB).chr(0xBF));
推薦教學:PHP影片教學
以上是php產生txt亂碼的詳細內容。更多資訊請關注PHP中文網其他相關文章!