修正雙編碼UTF8字元
錯誤的字元編碼可能會導致資料異常,例如「ñ」等西班牙字元的轉換到“à”。當 CSV 檔案被錯誤地解釋為 Latin1 編碼並隨後再次以 UTF8 編碼時,就會發生 UTF8 字元的雙重編碼,這是此問題的常見原因。
解決此問題並恢復預期字元表示,MySQL提供了一個專門的函數:
CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8)
這個函數接受雙重編碼的字串,首先使用CONVERT(field USING latin1)將其轉換回Latin1二進位字串,然後重新正確編碼使用CONVERT(CAST(...) AS BINARY) USING utf8) 轉換為UTF8。
要將更正應用於您的數據,請使用以下更新語句:
UPDATE tablename SET field = CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8);
此語句將更新tablename 表中的指定字段,用正確的UTF8 等效項替換雙編碼字元。透過正確處理字元編碼,您可以確保資料的完整性和準確性。
以上是如何修復 MySQL 資料庫中的雙編碼 UTF8 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!