登場人物:
文字は、さまざまな文字スキームやコード ページを使用して表現できる抽象的なエンティティ です。たとえば、Unicode UTF-16 エンコーディングは文字を 16 ビット整数のシーケンスとして表現しますが、Unicode UTF-8 エンコーディングは同じ文字を 8 ビット バイトのシーケンスとして表現します。共通言語ランタイムは、Unicode UTF-16 (Unicode Transformation Format、16 ビット エンコード) を使用して文字を表現します。
PHP では、UTF-8 エンコードでは 1 つの漢字が 3 文字を占めますが、gbk エンコードでは 2 文字しか占めません。
バイト:
バイトとは、ネットワーク上で情報を送信する(またはハードドライブやメモリに情報を保存する)単位です。
アプリケーション:
データベース内のテーブルが UTF8 でエンコードされており、フィールドが最大 10 文字に設定されている場合、最大記憶長は次のようになります: 'I am Zhong 1'