ホームページ > ウェブフロントエンド > htmlチュートリアル > gbk utf8の選び方 GBKとUTF-8を正しく理解して使いこなす Webページエンコード_HTML/Xhtml_Webページ制作

gbk utf8の選び方 GBKとUTF-8を正しく理解して使いこなす Webページエンコード_HTML/Xhtml_Webページ制作

WBOY
リリース: 2016-05-16 16:40:45
オリジナル
1882 人が閲覧しました

Web ページのエンコーディングは、英語に翻訳すると Web ページ エンコーディングと呼ばれ、Web ページ内の特定の文字エンコーディング形式を指定するライブラリです。
GBKは、国家規格GB2312をベースに拡張し、GB2312と互換性を持たせた規格です。 GBK のテキスト エンコーディングは 2 バイトで表されます。つまり、中国語と英語の文字は両方とも 2 バイトで表され、中国語の文字を区別するために最上位ビットが 1 に設定されます。 GBK にはすべての中国語の文字が含まれており、UTF8 よりも汎用性が低いですが、GBK よりも大きなデータベースを占有します。

UTF-8: Unicode TransformationFormat-8bit、BOM は許可されますが、通常は BOM は含まれません。これは、国際文字を解決するために使用されるマルチバイト エンコードで、英語の場合は 8 ビット (つまり 1 バイト)、中国語の場合は 24 ビット (3 バイト) を使用します。 UTF-8 には、世界中のすべての国で使用されている文字が含まれており、高い汎用性を持っています。 UTF-8 でエンコードされたテキストは、UTF8 文字セットをサポートするさまざまな国のブラウザで表示できます。 UTF8エンコーディングであれば、外国人の英語IEでも中国語を表示でき、IEの中国語サポートパッケージをダウンロードする必要がありません。
UTF-8 バージョンは優れた国際互換性を持っていますが、中国語バージョンは GBK/BIG5 バージョンよりも 50% 多くのデータベース ストレージ領域を必要とするため、推奨されず、国際互換性に対する特別な要件を持つユーザーのみが使用できます。簡単に言うと、中国語の文字が多い Web サイトの場合は、データベース スペースを節約するために GBK エンコードを使用するのが適切です。英語が多い Web サイトの場合は、データベース容量を節約するために UTF-8 を使用することが適切です。

GBK、GB2312 などを UTF8 に変換するにはどうすればよいですか? GBK、GB2312 などを UTF8 に変換するには、Unicode エンコードを使用する必要があります。GBK、GB2312—Unicode—UTF8、UTF8—Unicode—GBK、GB2312。 Windows のメモ帳で [名前を付けて保存] を使用すると、GBK、Unicode、Unicode ビッグ エンディアン、および UTF-8 エンコード方式の間で変換できます。

ブラウザに Web ページのエンコーディングを正しく識別させるにはどうすればよいですか?通常、Web ページには次の文が必要です:

関連ラベル:
gbk
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート