漢字の国家標準コードは何バイトのストレージを占有しますか?
中国語文字国家標準コードは、各漢字に対して国家的に統一されたコードを持つために、漢字エンコーディングの国家標準を公布することを目的として 1980 年に作成されました。各漢字には、漢字国家標準コードと呼ばれるバイナリ コードがあります。私の国の中国語文字コード標準 GB2312-80 には、バイナリ エンコーディングを指定する一般的に使用される中国語の文字が 6763 個あります。
国家標準コードは、漢字交換コードとも呼ばれ、コンピュータ間で漢字情報を交換する際に使用されるコード標準です。国家標準コードは 2 バイトで表されます。つまり、各漢字は 2 バイトで表されます。
GB2312-80 GB2312は、コードテーブルを1バイト目に相当する94個の領域に分割し、各領域は2バイト目に相当する94ビットを持ち、2バイトの値がエリアコード値となります。およびビット 数値に 32 (20H) を加算します。領域 01 ~ 09 は記号と数字、領域 16 ~ 87 は漢字、領域 10 ~ 15 と 88 ~ 94 はさらなる標準化が必要な空白領域です。 GB2312 は、収集された漢字を 2 つのレベルに分けています。第 1 レベルには、一般的に使用される 3755 文字が含まれ、エリア 16 ~ 55 に配置され、中国語のピンイン文字/ストローク形状の順序で配置されています。第 2 レベルの漢字には、常用漢字3008文字を56~87のエリアに配置し、部首・書き順に並べています。したがって、GB2312 は最大 6763 文字の漢字を表現できます。
以上が漢字の国家標準コードは何バイトのストレージを占有しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









1MB のストレージ容量は、2 の 20 乗バイト、つまり 1,048,576 バイトに相当します。 MB はコンピュータの記憶単位であり、「メガ」と発音されます。1MB は 1024KB、1KB は 1024B (バイト) に等しいため、1MB は 1048576 (1024 *1024) バイトに相当します。

128mb は 134217728 バイトを指します。バイト換算式は「1MB=1024KB=1048576B=8388608bit」です。これは、1048576 個の英字と 524288 個の漢字を保存できることを意味します。トラフィック単位の換算式は、1GB=1024MB、1MB=1024KB、1KB です。 = 1024B。

1 ビットは 1 バイトの 8 分の 1 に相当します。 2 進数体系では、0 または 1 がそれぞれ 1 ビット (bit) であり、ビットはデータ記憶の最小単位であり、8 ビット (bit、略して b) ごとに 1 バイト (Byte) が構成されます。バイト) = 8 ビット」。ほとんどのコンピュータ システムでは、バイトは 8 ビット (ビット) 長のデータ単位であり、文字、数字、またはその他の文字を表すためにバイトが使用されます。

1 つの ASCII 文字が 1 バイトを占めます。 ASCII コード文字は、コンピュータでは 7 ビットまたは 8 ビットのバイナリ エンコーディングで表され、1 バイトで格納されます。つまり、1 つの ASCII コードが 1 バイトを占めます。 ASCII コードは、標準 ASCII コードと拡張 ASCII コードに分けることができます。標準 ASCII コードは、基本 ASCII コードとも呼ばれます。7 ビットの 2 進数 (残り 1 桁は 0) を使用して、すべての大文字と小文字を表します。 0 ~ 9 の数字。アメリカ英語で使用される句読点および特殊な制御文字。

UTF8 でエンコードされた中国語文字は 3 バイトを占めます。 UTF-8 エンコードでは、1 つの中国語文字は 3 バイトに相当し、1 つの中国語の句読点は 3 バイトを占めますが、Unicode エンコードでは、1 つの中国語文字 (繁体字中国語を含む) は 2 バイトに相当します。 UTF-8 は各文字のエンコードに 1 ~ 4 バイトを使用します。1 つの US-ASCIl 文字のエンコードには 1 バイトのみが必要です。ラテン語、ギリシャ語、キリル文字、アルメニア語、および発音区別符号付きのヘブライ語。アラビア語、シリア語およびその他の文字は 2 バイトが必要です。エンコーディング。

ASCII コードは 1 バイトを占めます。ASCII コードは、文字を表すために使用されるコーディング標準です。7 ビットの 2 進数を使用して、文字、数字、句読点、特殊文字などを含む 128 個の異なる文字を表します。バイトはコンピュータの記憶装置の基本単位です。バイトは 8 つのバイナリ ビットで構成されます。各バイナリ ビットは 0 または 1 です。1 バイトは 256 の異なる値を表すことができるため、ASCII コードのすべての文字を表すことができます。

PHPでint型をbyte型に変換する方法を詳しく解説 PHPでは、ネットワークデータ送信やファイル処理、暗号化アルゴリズムなどを扱う場合など、整数型(int)をバイト型(Byte)に変換する必要が生じることがよくあります。 。この記事では、int型をbyte型に変換する方法と具体的なコード例を詳しく紹介します。 1. int 型と byte の関係 コンピュータ分野では、基本データ型 int は整数を表しますが、byte (バイト) はコンピュータの記憶単位で、通常は 8 ビットのバイナリデータです

4KB は、記憶ユニットが 4096 バイトであることを意味します。 KB は、コンピュータのデータ記憶単位バイトの倍数形式であるキロバイトを指します。キロバイトは 2 の累乗に基づきます。つまり、1 キロバイト (1KB) は 1024 バイト (B ) に等しいため、「4KB=4*」となります。 1024B=4096B"、つまり 4KB は 4096 バイトを表します。