URL エンコーディング
URL エンコーディングは、印刷できない文字や URL 内の特別な意味を持つ文字を、Web ブラウザーやサーバーで理解され、一般的に受け入れられる表現に変換することです。 これらの文字には次のものが含まれます:
ASCII 制御文字 - 出力制御によく使用される印刷不可能な文字。文字の範囲は、16 進数の 00 ~ 1F (10 進数の 0 ~ 31) および 7F (10 進数の 127) です。完全なコーディングシートを以下に示します。
非 ASCII 制御文字 - これらの文字は、128 ビット ASCII 文字セットの範囲外です。この範囲は ISO ラテン文字セットの一部であり、16 進数 00 ~ FF (10 進数 128 ~ 255) の範囲全体を含む ISO ラテン文字セットの「前半」です。完全なコーディングシートを以下に示します。
予約文字 - ドル記号、アンパサンド、プラス記号、ユニバーサル記号、スラッシュ、コロン、区切り文字、等号、疑問符、アットマークなどの記号。これらの記号はすべて URL 内で異なる意味を持っているため、エンコードが必要です。完全なコーディングシートを以下に示します。
安全でない文字 - スペース、疑問符、小なり記号、大なり記号、ポンド文字、パーセント記号、中括弧の左側部分、中括弧の右側部分、パイプ文字、バックスラッシュ、キャレット、チルダを含みます。左かぎ括弧、右かぎ括弧、墓アクセント。何らかの理由で、URL に存在するこれらの文字は誤解される可能性があります。これらの文字も常にエンコードする必要があります。完全なコーディングシートを以下に示します。
エンコード表現では、予期される文字を置き換える 3 つの文字が必要です: パーセント記号、ASCII 文字セット内の文字位置を示す 2 つの 16 進数、
例
最も一般的な特殊文字の 1 つはスペースです。 URL にスペースを直接入力することはできません。文字セットでは、スペースは 16 進数の 20 に相当します。したがって、サーバーにリクエストするときにスペースを表すために使用できます。
ASCII 制御文字エンコーディング
には、16 進数の 00 ~ 1F (10 進数の 0 ~ 31) および 7F (10 進数の 127) の文字コードが含まれます。
十进制格式 | 十六进制值 | 字符 | URL 编码 |
---|---|---|---|
0 | 00 |