一、問題
將查詢的資料以xls檔案匯出時(UTF-8編碼),資料正常;但以CSV檔案匯出時,檔案中的中文亂碼,同樣是UTF-8編碼,改成GBK編碼匯出時,中文顯示正常。
本來以為問題解決,後面匯出含拉丁字元(如ÀÆÊàÌ)的資料時,以xls檔案匯出資料正常顯示,以CSV檔案匯出時,檔案中的拉丁文字元顯示為「?」號。
相關影片教學推薦:java課程
二、解決方法
以CSV方式匯出的檔案中預設不含BOM訊息,透過給將要輸出的內容設定BOM標識(以EF BB BF 開頭的位元組流)即可解決此問題。
具體方法如下:
... OutputStreamWriter outputStreamWriter = new OutputStreamWriter(response.getOutputStream(), "UTF-8"); // 要输出的内容 result = (String)contentMap.get(RESPONSE_RESULT); response.setHeader("Content-Disposition", "attachment;filename=test.csv"); outputStreamWriter.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF})); outputStreamWriter.write(result); outputStreamWriter.flush();
如果是以OutputStream流實作的,參數可以如下修改:
out = response.getOutputStream(); //加上UTF-8文件的标识字符 out.write(new byte []{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF});
註:
BOM: Byte Order Mark,字節順序標記(以下摘自百度百科)
在UCS 編碼中有一個叫做“Zero Width No-Break Space” ,中文譯名為“零寬無間斷間隔”的字符,它的編碼是FEFF。而 FFFE 在 UCS 中是不存在的字符,所以不應該出現在實際傳輸中。
UCS 規範建議我們在傳輸位元組流前,先傳送字元“Zero Width No-Break Space”,這樣如果接收者收到FEFF,就表示這個位元組流是Big-Endian 的;如果收到FFFE,就表示這個位元組流是Little- Endian 的。
因此字元 “Zero Width No-Break Space(零寬無間斷間隔)” 又被稱為 BOM。
UTF-8 不需要 BOM 來表示位元組順序,但可以用 BOM 來表示編碼方式。字元 “Zero Width No-Break Space” 的 UTF-8 編碼是 EF BB BF。所以如果接收者收到以 EF BB BF 開頭的位元組流,就知道這是 UTF-8編碼了。
Windows 就是使用 BOM 來標記文字檔案的編碼方式的。
相關文章教學推薦:java入門學習
#以上是java中將查詢的資料以csv檔案匯出時出現亂碼的詳細內容。更多資訊請關注PHP中文網其他相關文章!