目次
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
ログイン後にコピー
" >TOP
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
ログイン後にコピー
ホームページ ウェブフロントエンド htmlチュートリアル htmlにおける文字セットの言語エンコードについて詳しく解説

htmlにおける文字セットの言語エンコードについて詳しく解説

Jul 22, 2017 pm 01:31 PM
charset html コーディング

HTMLの言語エンコーディングの重要性に注意してください

  • Directory


  1. charsetエンコーディングの重要性

  2. HTML の文字セットはどこですか

  3. charsetタグ

  4. エンコーディングタイプ

  5. charset utf-8の概要

  6. charset GB2312の概要

  7. エンコーディング、Webページの互換性のため

1.コーディングの -

TOP

視聴者が IE を使用している場合、エンコーディングは Web ページの文字化けを引き起こす可能性があり、また、p+css 互換性ハックにつながる可能性があります。

2. エンコード位置 -

TOP

3. HTML エンコードスタイル -

TOP
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
ログイン後にコピー

charset=utf-8 の utf-8 を変更することで、Web ページのエンコードを変更できます。
通常、CSS ファイルを作成するときは、CSS ファイルの先頭で
@charset "utf-8"; を使用して、この CSS ファイルのエンコード タイプを定義する必要もあります。一般に、HTML ソース コードと CSS ファイルのエンコーディングは統一する必要があります。統一されていないと、CSS ハック、ページの文字化け、ページ レイアウトの混乱などの互換性の問題が発生します。

4. 一般的に使用される HTML エンコード タイプ -

TOP

中国で一般的に使用される 2 つの一般的なタイプは、utf-8 と gb2312 です。一般に、これら 2 つのタイプは国内の Web ページのエンコードのニーズを満たすことができます。もちろん、これら 2 つのエンコーディング タイプは、Web ページを処理したりデータ型を保存したりするためにプログラムやデータベースでも使用されます。

5. UTF-8 には次の特徴があります: -

TOP

    UCS 文字 U+0000 から U+007F (ASCII) はバイト 0x00 から 0x7F (ASCII 互換) としてエンコードされます。これは 7 つのファイルのみを含むことを意味します。 ASCII 文字の場合は、ASCII と UTF-8 の両方のエンコード方式で同じです。
  1. U+007F を超えるすべての UCS 文字はマルチバイト文字列としてエンコードされ、各バイトにはフラグ ビットが設定されます。したがって、ASCII バイト (0x00- 0x7F) は他の文字の一部にすることはできません
  2. 非 ASCII 文字を表すマルチバイト文字列の最初のバイトは常に 0xC0 から 0xFD の範囲内にあり、この文字に含まれるバイト数を示します。マルチバイト文字列の範囲は 0x80 から 0xBF です。これにより、再同期が非常に簡単になり、エンコーディングがボーダレスになり、欠落バイトの影響が少なくなります。
  3. 可能なすべての 231 UCS コードをエンコードできます
  4. UTF-8 でエンコードされた文字を使用できます。理論的には最大 6 バイトの長さですが、16 ビット BMP 文字の長さは最大 3 バイトまでです。
  5. Bigendian UCS-4 バイト文字列の配置順序は事前に決定されています
  6. バイト 0xFE と 0xFF は決して存在しません。 UTF-8 エンコーディングで使用されます。
  7. 6. GB2312 には次の特徴があります -
TOP

GB2312 標準には、3755 の第 1 レベルの中国語文字と 3008 の第 2 レベルの中国語文字を含む、合計 6763 の中国語文字が含まれています。同時に、GB2312 には、ラテン文字、ギリシャ文字、日本語のひらがなおよびカタカナ文字、および 682 個の全角ロシア文字が含まれています。

GB2312 の登場は、基本的に漢字のコンピュータ処理ニーズを満たしており、それに含まれる漢字は使用頻度の 99.75% をカバーしています。 GB2312 では、収集された漢字が「分割」され、各ゾーンには 94 個の漢字/記号が含まれます。この表現は位置コードとも呼ばれます。

01-09 エリアは特別なシンボルです。

エリア 16 ~ 55 は、ピンインでソートされた第 1 レベルの漢字です。

領域56〜87は、部首/画数ごとに分類された第2レベルの漢字です。

地区 10 ~ 15 および 88 ~ 94 はコード化されていません。

たとえば、「あ」という文字は GB2312 の最初の漢字であり、その位置コードは 1601 です。 GB2312 を使用するプログラムでは、通常、バイト構造は EUC 格納方式を使用するため、 アスキーと互換性があります。各漢字と記号は 2 バイトで表されます。最初のバイトは「上位バイト」と呼ばれ、2 番目のバイトは「下位バイト」と呼ばれます。 「上位バイト」は0xA1~0xF7(エリアコード01~87に0xA0を加算)、「下位バイト」は0xA1~0xFE(0xA0に01~94を加算)を使用します。例えば 単語「ah」は、ほとんどのプログラムで 0xB0A1 として保存されます。 (ロケーション コードと比較してください: 0xB0=0xA0+16、0xA1=0xA0+1)。

GB2312エンコードにおける漢字市外局番の10進法は176から247、ビットコードは161から255となります。 6763が格納される理由は、市外局番が215であるため、82*94=6768より小さくなります。ビット コードは 250 です。254 の間にはコードが 5 つあり、漢字コードがないため、6768-5=6763 となります。

GB2312 エンコードは、中国の共通言語として簡単に理解できます。

7. 推奨される文字セット エンコーディング -

TOP

UTF-8 は、台湾や中国本土などの簡体字中国語と繁体字中国語で簡単に理解できます。

8. エンコーディングによって引き起こされる Web ページの互換性エラー: - TOP

エンコーディングが混在している場合、Web ページは文字化けします。これは、特に CSS コメントにエンコーディングが混在している場合に発生します。 CSSハック。

今後Webページを作成する際には、Webページのエンコーディングの宣言を忘れないようにしていただければ幸いです。

このページを閲覧したユーザーは次のコンテンツも閲覧しています:
1. UTF-8 GBK UTF8 GB2312 の違いと関係
2. HTML エンコード設定の選択方法
3.

以上がhtmlにおける文字セットの言語エンコードについて詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

HTMLの表の境界線 HTMLの表の境界線 Sep 04, 2024 pm 04:49 PM

HTML の表の境界線に関するガイド。ここでは、HTML でのテーブルの境界線の例を示しながら、テーブル境界線を定義する複数の方法について説明します。

HTML 左マージン HTML 左マージン Sep 04, 2024 pm 04:48 PM

HTML マージン左のガイド。ここでは、HTML margin-left の概要とその例、およびそのコード実装について説明します。

HTML のネストされたテーブル HTML のネストされたテーブル Sep 04, 2024 pm 04:49 PM

これは、HTML でのネストされたテーブルのガイドです。ここでは、テーブル内にテーブルを作成する方法をそれぞれの例とともに説明します。

HTML テーブルのレイアウト HTML テーブルのレイアウト Sep 04, 2024 pm 04:54 PM

HTML テーブル レイアウトのガイド。ここでは、HTML テーブル レイアウトの値と例および出力について詳しく説明します。

HTML入力プレースホルダー HTML入力プレースホルダー Sep 04, 2024 pm 04:54 PM

HTML 入力プレースホルダーのガイド。ここでは、コードと出力とともに HTML 入力プレースホルダーの例について説明します。

HTML 順序付きリスト HTML 順序付きリスト Sep 04, 2024 pm 04:43 PM

HTML 順序付きリストのガイド。ここでは、HTML 順序付きリストと型の導入とその例についても説明します。

HTML 内のテキストの移動 HTML 内のテキストの移動 Sep 04, 2024 pm 04:45 PM

HTML でのテキストの移動に関するガイド。ここでは、概要、マーキー タグが構文でどのように機能するか、および実装例について説明します。

HTML の onclick ボタン HTML の onclick ボタン Sep 04, 2024 pm 04:49 PM

HTML オンクリック ボタンのガイド。ここでは、それらの紹介、動作、例、およびさまざまなイベントでの onclick イベントについてそれぞれ説明します。

See all articles