#このチュートリアルの動作環境: Windows7 システム、C99 バージョン、Dell G3 コンピューター。 文字データは、バイトである ASCII コード値とともにメモリに保存されます。すべてのデータ型は、0 と 1 のバイナリ コードでメモリに保存されます。この原則は変わりません。 C言語におけるchar型データとは、文字定数を文字変数に入れることであり、文字そのものをメモリユニットに入れるのではなく、文字に対応するASCIIコードを文字変数に入れることです。記憶装置。 エンコードでは、1 つの漢字ストレージに 2 バイトが必要です。 UTF-8 エンコードでは、英語のアルファベット文字の格納には 1 バイトが必要で、漢字の格納には 3 ~ 4 バイトが必要です。 UTF-16 エンコードでは、英語のアルファベット 1 文字または中国語 1 文字を格納するには 2 バイトが必要です。 UTF-32 エンコードでは、世界中のあらゆる文字を保存するには 4 バイトが必要です。 拡張情報: ASCII ((American Standard Code for Information Interchange): American Standard Code for Information Interchange) は、以下に基づくコンピューター コードのセットです。ラテン文字体系は、主に現代英語およびその他の西ヨーロッパ言語を表示するために使用されます。これは最も一般的な情報交換標準であり、国際標準 ISO/IEC 646 と同等です。 ASCII が初めて標準化されたタイプとして公開されたのは 1967 年で、最後の更新は 1986 年でした。これまでのところ、合計 128 文字が定義されています。ASCII コードは、指定された 7 ビットまたは 8 ビットを使用します。 -bit binary 配列は、128 または 256 個の可能な文字を表すように結合されます。標準 ASCII コード (基本 ASCII コードとも呼ばれます) は、7 つの 2 進数 (残りの 1 つの 2 進数は 0) を使用して、すべての大文字と小文字、0 ~ 9 の数字、句読点、およびアメリカ英語で使用される特殊なコントロールを表します。 ] 。このうち 0 ~ 31 と 127 (計 33 個) は制御文字または特殊通信文字 (残りは表示可能な文字) で、制御文字: LF (改行)、CR (キャリッジ リターン) などです。 、FF(改ページ)、DEL(削除)、BS(バックスペース)、BEL(リング)など、通信特殊文字:SOH(本文の先頭)、EOT(本文の末尾)、ACK(確認)など。 ; ASCII 値の 8、9、10、13 はそれぞれバックスペース、タブ、ラインフィード、キャリッジリターン文字に変換されます。特定のグラフィック表示はありませんが、さまざまなアプリケーションに応じてテキスト表示にさまざまな効果をもたらします [1] 。 32~126(計95)は文字(32はスペース)で、そのうち48~57は0~9までの10個のアラビア数字です。 65 ~ 90 は 26 文字の大文字英字、97 ~ 122 は 26 文字の小文字英文字、残りは句読点や算術記号などです。 標準 ASCII では、その最上位ビット (b7) がパリティ ビットとして使用されることにも注意してください。いわゆるパリティチェックとは、符号伝送時にエラーが発生していないかをチェックする方法であり、大きく分けて奇数チェックと偶数チェックの2種類に分けられます。奇数パリティ ルール: 正しいコードのバイト内の 1 の数は奇数である必要があります。奇数でない場合は、最上位ビット b7 に 1 を追加します。偶数パリティ ルール: 正しいコードのバイト内の 1 の数。正しいコードは偶数でなければなりません。偶数でない場合は、最上位ビット b7 に 1 [1] を加算します。 最後の 128 は拡張 ASCII コードと呼ばれます。多くの x86 ベースのシステムは、拡張 (または「高」) ASCII の使用をサポートしています。拡張 ASCII では、各文字の 8 番目のビットを使用して、追加の 128 個の特殊記号文字、外国文字、およびグラフィック記号を決定できます。 関連する推奨事項: 「メモリ上の文字データの格納形式はASCIIコードです。文字データとは、文字定数を文字変数に入れるもので、文字そのものを記憶装置に置くのではなく、文字に対応するASCIIコードを記憶装置に置きます。
C 言語ビデオ チュートリアル 」
以上がメモリ上の文字データの格納形式は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。