字符编码 - java读取文件的编码问题:有无BOM的UTF-8和GBK
迷茫
迷茫 2017-04-17 15:02:29
0
3
832

java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教

迷茫
迷茫

业精于勤,荒于嬉;行成于思,毁于随。

全員に返信(3)
Ty80

ユーザーがアップロードしたファイルはさまざまな方法でエンコードされている可能性があるのは事実ですが、完璧な解決策が保証されるわけではありませんが、統計原則に基づいて最大限のファイル エンコード検出を提供できます。

私は基本的に私のニーズを解決するこの cpdetector を使用しました。

コード例を添付します:

リーリー

ファイルを書き込む方法は教えません。ファイルには URL を取得する方法があります。

これらの jar を使用するときにインポートしました。

リーリー

見つからない場合は、メールを残していただければお送りします。

いいねを押す +0
洪涛

InputStreamReaderを使用するとエンコーディングを指定できます。

いいねを押す +0
Ty80

まだ完璧な解決策は見つかりません

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!