Web ページのエンコーディングは、英語に翻訳すると Web ページ エンコーディングと呼ばれ、Web ページ内の特定の文字エンコーディング形式を指定するライブラリです。
GBKは、国家規格GB2312をベースに拡張し、GB2312と互換性を持たせた規格です。 GBK のテキスト エンコーディングは 2 バイトで表されます。つまり、中国語と英語の文字は両方とも 2 バイトで表され、中国語の文字を区別するために最上位ビットが 1 に設定されます。 GBK にはすべての中国語の文字が含まれており、UTF8 よりも汎用性が低いですが、GBK よりも大きなデータベースを占有します。
UTF-8: Unicode TransformationFormat-8bit、BOM は許可されますが、通常は BOM は含まれません。これは、国際文字を解決するために使用されるマルチバイト エンコードで、英語の場合は 8 ビット (つまり 1 バイト)、中国語の場合は 24 ビット (3 バイト) を使用します。 UTF-8 には、世界中のすべての国で使用されている文字が含まれており、高い汎用性を持っています。 UTF-8 でエンコードされたテキストは、UTF8 文字セットをサポートするさまざまな国のブラウザで表示できます。 UTF8エンコーディングであれば、外国人の英語IEでも中国語を表示でき、IEの中国語サポートパッケージをダウンロードする必要がありません。
UTF-8 バージョンは優れた国際互換性を持っていますが、中国語バージョンは GBK/BIG5 バージョンよりも 50% 多くのデータベース ストレージ領域を必要とするため、推奨されず、国際互換性に対する特別な要件を持つユーザーのみが使用できます。簡単に言うと、中国語の文字が多い Web サイトの場合は、データベース スペースを節約するために GBK エンコードを使用するのが適切です。英語が多い Web サイトの場合は、データベース容量を節約するために UTF-8 を使用することが適切です。
GBK、GB2312 などを UTF8 に変換するにはどうすればよいですか? GBK、GB2312 などを UTF8 に変換するには、Unicode エンコードを使用する必要があります。GBK、GB2312—Unicode—UTF8、UTF8—Unicode—GBK、GB2312。 Windows のメモ帳で [名前を付けて保存] を使用すると、GBK、Unicode、Unicode ビッグ エンディアン、および UTF-8 エンコード方式の間で変換できます。
ブラウザに Web ページのエンコーディングを正しく識別させるにはどうすればよいですか?通常、Web ページには次の文が必要です: