以程式設定Java 中的檔案編碼
在各種場景下,包含無法讀取ISO-8859-1 編碼的文件,就變得有必要以程式方式確定輸入流或文件的正確字元集編碼。然而,與 XML 或 HTML 等結構化文件格式不同,任意位元組流不會明確聲明其編碼。
位元組流編碼確定中的挑戰
主要挑戰在於編碼的固有性質。編碼在位元組值與其對應字元之間建立映射。因此,不可能從給定的位元組流中明確確定正確的編碼。任何編碼都可能有效。
現有框架限制
Java 中的 getEncoding() 方法應用於流時,會擷取為此流明確設定的編碼。它不會嘗試根據流的內容推斷編碼。
猜測流編碼的方法
儘管有限制,但還是有一些方法可以估計編碼:
後備選項
以上是如何以程式設計方式確定 Java 中檔案的編碼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!