最近、Java がテキスト ファイル (csv ファイル、txt ファイルなど) を読み取るときに、中国語の文字が含まれると文字化けする問題が発生しました。 (推奨: java ビデオ チュートリアル )
コードを次のように読んでください。
List<String> lines=new ArrayList<String>(); BufferedReader br = new BufferedReader(new FileReader(fileName)); String line = null; while ((line = br.readLine()) != null) { lines.add(line); } br.close();
Principle
Java の I/O クラスの処理は、次のとおりです。図:
Reader クラスは Java の I/O で文字を読み取るための親クラスであり、InputStream クラスはバイトを読み取るための親クラスであり、InputStreamReader クラスはバイトと文字を関連付けるブリッジです。 I/O プロセス中の処理を担当し、読み取りバイトから文字への変換、およびバイトから文字への特定のデコードは StreamDecoder によって実装されます。
Charset エンコード形式は、StreamDecoder デコード プロセス中にユーザーが指定する必要があります。 Charset を指定しない場合は、ローカル環境のデフォルトの文字セットが使用されることに注意してください (たとえば、中国語環境では GBK エンコードが使用されます)。
概要: Java がデータ ストリームを読み取るときは、データ ストリームのエンコード方式を指定する必要があります。指定しないと、ローカル環境のデフォルトの文字セットが使用されます。
上記の分析後、変更されたコードは次のようになります。
List<String> lines=new ArrayList<String>(); BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(fileName),"UTF-8")); String line = null; while ((line = br.readLine()) != null) { lines.add(line); } br.close();
Java の詳細については、java 基本チュートリアル 列に注目してください。
以上がJavaファイルで中国語が文字化けする原因と解決策の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。