Java はテキスト ファイル (csv ファイル、txt ファイルなど) を読み取るのですが、中国語に遭遇すると文字化けします。 (推奨: java ビデオ チュートリアル )
読み取りコードは次のとおりです:
List<String> lines=new ArrayList<String>(); BufferedReader br = new BufferedReader(new FileReader(fileName)); String line = null; while ((line = br.readLine()) != null) { lines.add(line); } br.close();
Java が文字化けしたファイルを読み取る原理:
Java /O クラスの処理は図のようになります。
Reader クラスは Java の I/O で文字を読み取るための親クラスであり、InputStream クラスはバイトを読み取るための親クラス InputStreamReader クラス バイトを文字に関連付けるブリッジです。I/O プロセス中に、読み取ったバイトから文字への変換を処理します。バイトから文字への特定のデコードは、StreamDecoder によって実装されます。 StreamDecoder のデコード処理はユーザーが行う必要があり、Charset エンコード形式を指定します。 Charset を指定しない場合は、ローカル環境のデフォルトの文字セットが使用されることに注意してください (たとえば、中国語環境では GBK エンコードが使用されます)。
概要: Java がデータ ストリームを読み取るときは、データ ストリームのエンコード方式を指定する必要があります。指定しないと、ローカル環境のデフォルトの文字セットが使用されます。
上記の分析後、変更されたコードは次のようになります。
List<String> lines=new ArrayList<String>(); BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(fileName),"UTF-8")); String line = null; while ((line = br.readLine()) != null) { lines.add(line); } br.close();
Java の詳細については、java 基本チュートリアル 列に注目してください。
以上がJava でのファイル読み取り時の文字化け問題の詳細なグラフィックとテキストの説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。