URL 編碼
URL 編碼就是將 URLs 中不宜列印的字元或具有特殊意義的字元轉換為 Web 瀏覽器和伺服器明白且普遍接受的表示法。 這些字符包括:
ASCII 控製字元 - 不宜列印的字元通常用於輸出控制。字元範圍是十六進位的 00-1F(十進位的 0-31)和 7F(十進位的 127)。下面提供了完整的編碼表。
非 ASCII 控製字元 - 這些字元超出了 128 個 ASCII 字元集的範圍。這個範圍是 ISO-拉丁字元集的一部分以及包含整個十六進位的 ISO-拉丁字元集 00-FF (十進位的 128-255)的「前半部」。下面提供了完整的編碼表。
保留字元 - 諸如美元符號,和號,加號,通用符號,正斜杠,冒號,分好,等號,問號以及 “at”這類符號。所有這些符號在 URL 內都有不同的意義,因此需要編碼。下面提供了完整的編碼表。
不安全字符 - 包括空格,問號,小於符號,大於符號,磅字符,百分比符號,大括號左邊部分,大括號右邊部分,管道符,反斜杠,插入符號,波浪線。左方括號,右方括號,沉音。出於某些原因,這些字元出現在 URLs 中存在被誤解的可能性。這些字符也應該始終被編碼。下面提供了完整的編碼表。
編碼表示法需要三個字元替換期望的字元:一個百分號,兩個在 ASCII 字元集中表示字元位置的十六進位數字、
範例
最常見的特殊字元之一是空格。我們不能在 URL 中直接輸入一個空格。空格在字元集中就是十六進位的 20。因此請求伺服器時可以使用 表示空格。
ASCII 控製字元編碼
包括十六進位的 00-1F(十進位的 0-31)和 7F(十進位的 127)字元碼。
十进制格式 | 十六进制值 | 字符 | URL 编码 |
---|---|---|---|
0 | 00 |