字符编码 - java读取文件的编码问题:有无BOM的UTF-8和GBK
迷茫
迷茫 2017-04-17 15:02:29
0
3
852

java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教

迷茫
迷茫

业精于勤,荒于嬉;行成于思,毁于随。

모든 응답(3)
Ty80

사용자가 업로드한 파일이 다양한 방식으로 인코딩될 수 있는 것은 사실입니다. 완벽한 해결을 보장할 수는 없지만 통계적 원리에 따라 최대한 파일 인코딩 감지 기능을 제공할 수 있습니다.

나는 기본적으로 내 요구 사항을 해결하는 이 cpDetector를 사용했습니다.

첨부된 코드 예시는 다음과 같습니다.

으아악

파일을 작성하는 방법은 제공하지 않습니다. 파일에는 URL을 가져오는 방법이 있습니다.

이 항아리는 사용할 때 수입해서 사용했어요.

으아악

찾지 못하실 경우 이메일을 남겨주시면 보내드리겠습니다.

洪涛

InputStreamReader를 사용하면 인코딩을 지정할 수 있습니다.

Ty80

아직 완벽한 솔루션을 찾을 수 없습니다

최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿