htmlにおける文字セットの言語エンコードについて詳しく解説-htmlチュートリアル-php.cn

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

ログイン後にコピー

" >TOP

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

ログイン後にコピー

ホームページ

ウェブフロントエンド

htmlチュートリアル

htmlにおける文字セットの言語エンコードについて詳しく解説

黄舟

Jul 22, 2017 pm 01:31 PM

charset html コーディング

HTMLの言語エンコーディングの重要性に注意してください

Directory

charsetエンコーディングの重要性
HTML の文字セットはどこですか
charsetタグ
エンコーディングタイプ
charset utf-8の概要
charset GB2312の概要
エンコーディング、Webページの互換性のため

1.コーディングの -

TOP

視聴者が IE を使用している場合、エンコーディングは Web ページの文字化けを引き起こす可能性があり、また、p+css 互換性ハックにつながる可能性があります。

2. エンコード位置 -

TOP

3. HTML エンコードスタイル -

TOP

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

ログイン後にコピー

charset=utf-8 の utf-8 を変更することで、Web ページのエンコードを変更できます。
通常、CSS ファイルを作成するときは、CSS ファイルの先頭で
@charset "utf-8"; を使用して、この CSS ファイルのエンコードタイプを定義する必要もあります。一般に、HTML ソースコードと CSS ファイルのエンコーディングは統一する必要があります。統一されていないと、CSS ハック、ページの文字化け、ページレイアウトの混乱などの互換性の問題が発生します。

4. 一般的に使用される HTML エンコードタイプ -

TOP

中国で一般的に使用される 2 つの一般的なタイプは、utf-8 と gb2312 です。一般に、これら 2 つのタイプは国内の Web ページのエンコードのニーズを満たすことができます。もちろん、これら 2 つのエンコーディングタイプは、Web ページを処理したりデータ型を保存したりするためにプログラムやデータベースでも使用されます。

5. UTF-8 には次の特徴があります: -

TOP

GB2312 標準には、3755 の第 1 レベルの中国語文字と 3008 の第 2 レベルの中国語文字を含む、合計 6763 の中国語文字が含まれています。同時に、GB2312 には、ラテン文字、ギリシャ文字、日本語のひらがなおよびカタカナ文字、および 682 個の全角ロシア文字が含まれています。

GB2312 の登場は、基本的に漢字のコンピュータ処理ニーズを満たしており、それに含まれる漢字は使用頻度の 99.75% をカバーしています。 GB2312 では、収集された漢字が「分割」され、各ゾーンには 94 個の漢字/記号が含まれます。この表現は位置コードとも呼ばれます。

01-09 エリアは特別なシンボルです。

エリア 16 ～ 55 は、ピンインでソートされた第 1 レベルの漢字です。

領域56〜87は、部首/画数ごとに分類された第2レベルの漢字です。

地区 10 ～ 15 および 88 ～ 94 はコード化されていません。

たとえば、「あ」という文字は GB2312 の最初の漢字であり、その位置コードは 1601 です。 GB2312 を使用するプログラムでは、通常、バイト構造は EUC 格納方式を使用するため、アスキーと互換性があります。各漢字と記号は 2 バイトで表されます。最初のバイトは「上位バイト」と呼ばれ、2 番目のバイトは「下位バイト」と呼ばれます。「上位バイト」は0xA1～0xF7（エリアコード01～87に0xA0を加算）、「下位バイト」は0xA1～0xFE（0xA0に01～94を加算）を使用します。例えば単語「ah」は、ほとんどのプログラムで 0xB0A1 として保存されます。 (ロケーションコードと比較してください: 0xB0=0xA0+16、0xA1=0xA0+1)。

GB2312エンコードにおける漢字市外局番の10進法は176から247、ビットコードは161から255となります。 6763が格納される理由は、市外局番が215であるため、82*94=6768より小さくなります。ビットコードは 250 です。254 の間にはコードが 5 つあり、漢字コードがないため、6768-5=6763 となります。

GB2312 エンコードは、中国の共通言語として簡単に理解できます。

7. 推奨される文字セットエンコーディング -

TOP

UTF-8 は、台湾や中国本土などの簡体字中国語と繁体字中国語で簡単に理解できます。

8. エンコーディングによって引き起こされる Web ページの互換性エラー: - TOP

エンコーディングが混在している場合、Web ページは文字化けします。これは、特に CSS コメントにエンコーディングが混在している場合に発生します。 CSSハック。

今後Webページを作成する際には、Webページのエンコーディングの宣言を忘れないようにしていただければ幸いです。

このページを閲覧したユーザーは次のコンテンツも閲覧しています:
1. UTF-8 GBK UTF8 GB2312 の違いと関係
2. HTML エンコード設定の選択方法
3.

以上がhtmlにおける文字セットの言語エンコードについて詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。