バイト (Byte) は、コンピュータ情報技術で記憶容量を測定するために使用される測定単位であり、2 進数の文字列を 1 つの単位として処理し、情報を構成する小さな単位です。 . .最も一般的に使用されるバイトはオクテットです。つまり、8 ビットの 2 進数が含まれます。
エンコード方式が異なると、1 文字に占めるバイト数が異なります。
ASCII コード:
英語 1 文字 (大文字と小文字に関係なく) は 1 バイトのスペースを占め、中国語 1 文字は 1 バイトのスペースを占めます。漢字は 2 バイトのスペースを占めます。コンピューターでデジタル単位として使用される 2 進数のシーケンスは、通常、10 進数に変換された 8 ビットの 2 進数です。最小値は 0、最大値は 255 です。たとえば、ASCII コードはバイトです。
UTF-8 エンコード:
英語の 1 文字は 1 バイトに相当し、中国語の 1 文字 (繁体字中国語を含む) は 3 バイトに相当します。
Unicode エンコード:
1 つの英語の単語は 2 バイトに相当し、1 つの中国語文字 (繁体字中国語を含む) は 2 バイトに相当します。
記号:
英語の句読点は 1 バイト、中国語の句読点は 2 バイトを占めます。たとえば、英語のピリオド「.」は 1 バイトを占め、中国語のピリオド「.」は 2 バイトを占めます。
概要:
ASCII コードと Unicode コードをエンコードする場合、8 ビット バイナリは英語の文字を表し、16 ビット バイナリは正午の文字を表します。 UTF-8 エンコードでは、8 ビット バイナリは英語の文字を表し、24 ビット バイナリは中国語の文字を表します。
以上が1 文字を表す 2 進数は何桁ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。