Java でのファイル エンコーディングのプログラムによる決定
ISO-8859-1 でエンコードされたファイルを読み取れないなど、さまざまなシナリオで、入力ストリームまたはファイルの正しい文字セット エンコーディングをプログラムで決定します。ただし、XML や HTML などの構造化ファイル形式とは異なり、任意のバイト ストリームはそのエンコーディングを明示的に宣言しません。
バイト ストリーム エンコーディングの決定における課題
主な課題は次のとおりです。エンコーディングの固有の性質。エンコーディングは、バイト値とそれに対応する文字の間のマッピングを確立します。したがって、特定のバイト ストリームから正しいエンコーディングを明確に確認することは不可能です。すべてのエンコーディングが有効である可能性があります。
既存のフレームワークの制限
Java の getEncoding() メソッドは、ストリームに適用されると、そのストリームに明示的に設定されたエンコーディングを取得します。 。ストリームのコンテンツに基づいてエンコーディングを推測しようとするものではありません。
ストリーム エンコーディングを推測するためのアプローチ
制限にもかかわらず、エンコーディングを推定するアプローチはあります。
フォールバックオプション
以上がJava でファイルのエンコーディングをプログラム的に決定するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。