Java では、デフォルトの文字セットの決定は微妙な問題になる場合があります。よくある誤解は、Charset.defaultCharset() が最終的な答えを提供するというものです。ただし、質問で強調されているように、このメソッドは特定の状況で使用される実際のデフォルトの文字セットと一致しない可能性があります。
この質問は、Java が 2 つの異なる文字セットを維持しているように見えることを明らかにしています。デフォルトの文字セット。 1 つ目は、Charset.defaultCharset() によって返されるキャッシュされた文字セットです。 2 番目は、OutputStreamWriter などの Java I/O クラスによって内部的に使用される「実際の」デフォルトの文字セットです。
Java 5 では、デフォルトの文字セットは Charset.defaultCharset( ) は、JVM の初期化時にキャッシュされません。これは、メソッドの呼び出しごとに、システム プロパティ「file.encoding」に基づいて適切な文字セットを決定しようとすることを意味します。このプロパティが設定されている場合、メソッドは対応する文字セットを返すか、見つからない場合はデフォルトの UTF-8 を返します。
この問題は、ファイル エンコーディングが明示的に次のように設定されている場合に発生します。質問のコード例に示されているように、ランタイム。開発者は、プロパティを「Latin-1」に設定することで、システムのデフォルトをオーバーライドすることを意図していました。ただし、この変更は、Charset.defaultCharset() で使用されるキャッシュされた文字セットには影響しません。その結果、このメソッドへの後続の呼び出しでは、キャッシュされた UTF-8 が返されます。これは、I/O クラスで使用される「実際の」デフォルトの文字セットと矛盾します。
Java 6 では、この問題は解決されました。キャッシュされた文字セットは JVM の初期化時に設定され、Charset.defaultCharset() は一貫してこのキャッシュされた値を返します。さらに、I/O クラスは Charset.defaultCharset() に依存してデフォルトのエンコードを決定し、デフォルトの文字セットを取得するためのさまざまなメソッド間の調整を保証します。
Charset.defaultCharset() の動作) Java 5 では、I/O クラスによって内部的に使用される実際のデフォルトの文字セットとの不一致が生じる可能性があります。 Java 6 では、JVM の初期化時にデフォルトの文字セットをキャッシュし、Java メソッド全体でその使用を標準化することで、この問題を解決しています。 Charset.defaultCharset() に依存したくなりますが、このプロパティは Java の異なるバージョン間で変更される可能性のある実装の詳細を表すことを覚えておくことが重要です。
以上がJava 5 のデフォルトの文字セットの動作が一貫性がないのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。