HTML 基本チュートリアル コンピュータコーディング (文字セット)
コンピューターのエンコーディング (文字セット) - コンピューターはバイナリ データのみを処理できるため、
なぜ文字セットがあるのかを理解します。コンピューターが人間の言語 (0 ~ 9、a ~ z、A ~ Z、特殊記号) を認識するには、各文字を「エンコード」する必要があります。いわゆる「エンコーディング」とは、各文字を異なるバイナリ システムで表現できることを意味します。
仮定: A は 2 進数で 1000 を表し、B は 2 進数で 1001 を表します。
ASCII エンコード: すべての文字を表すのに 1 バイト (8 ビット 2 進数) が使用され、合計 2^8 = 256 を表すことができます。
ANSI エンコーディング: 他の国では、自国の言語を表示するために ASCII エンコーディングを拡張しています。
ANSI (中国語のオペレーティング システムでは gb2312
ANSI)、従来のオペレーティング システムでは big5
ANSI、日本語のオペレーティング システムでは JIS
...
2 バイト (16 ビット バイナリ) を使用します (表現するには、合計 2^16 = 65536 文字を表現できます。
GB2312 には、合計 6763 の漢字が含まれます。
GBK エンコード: GB2312)一部の人気のない文字、珍しい文字、古代中国語などを拡張して収録
漢字を合計21,000文字収録
- 欠点: 1 つの文字を表すために 32 ビット バイナリを使用すると、スペースが膨大に消費されます。
- 前提条件: 1 000000000000000000000000000001 を表すには Unicode エンコーディングを使用します。
「国」を使用できます。