Dans cet article, nous découvrirons en détail le codage d’URL HTML. HTML URL est un acronyme de Uniform Resource Locator vers une adresse globale ou IP sur le World Wide Web. Le serveur Web obtient la page en utilisant l'URL du navigateur Web.
Exemple : https://www.google.com est l'une des URL.
Le jeu de caractères ASCII est important pour l'encodage d'URL HTML. L'URL est envoyée à Internet à l'aide du jeu de caractères ASCII. Les caractères non-ASCII sont restreints car ils peuvent créer un conflit lors de la recherche du chemin d'accès à la page vers le serveur. En raison de ce problème, HTML utilise le codage d'URL.
L'encodage d'URL HTML convertit le caractère non-ASCII dans un format pouvant être envoyé sur Internet. Les utilisateurs peuvent être convertis en utilisant « % » pour continuer avec deux chiffres hexadécimaux.
Si je mets de l'espace dans le formulaire, alors l'encodage de l'URL est HTML+CSS.
<a href="my file.html">
Si nous accordons de l'espace dans une URL, l'encodage de l'URL se produira sous la forme my%20file.html.
Voici les exemples d'encodage d'URL HTML expliqués en détail :
Voici le tableau utilisé pour l'encodage des caractères réservés.
Characters | $ | & | + | , | / | : | ; | = | ? | @ |
URL Encode | 24% | 26% | %2b | %2c | %2f | %3a | %3b | %3d | %3f | 40% |
Characters | space | “ | < | > | # | % | { | } | | | ^ | ~ | [ | ] | |
URL Encode | 20% | 22% | %3c | %3e | 23% | 25% | %7b | %7d | %7c | %5c | %5e | %7e | %5b | %5d |
Voici le tableau utilisé pour l'encodage des caractères non-ASCII.
Character | URL Encode | Character | URL Encode | Character | URL Encode | Character | URL Encode |
€ | %80 | ˜ | %98 | « | %ab | ¿ | %bf |
‚ | %82 | ™ | %99 | ¬ | %ac | À | %c0 |
ƒ | %83 | š | %9a | ª | %aa | Á | %c1 |
„ | %84 | › | %9b | ® | %ae | Â | %c2 |
… | %85 | œ | %9c | ¯ | %af | à | %c3 |
† | %86 | | %9d | ° | %b0 | Ä | %c4 |
‡ | %87 | ž | %9e | ± | %b1 | Å | %c5 |
ˆ | %88 | Ÿ | %9f | ² | %b2 | Æ | %v6 |
‰ | %89 | × | %d7 | ³ | %b3 | Ç | %c7 |
Š | %8a | ¡ | %a1 | ´ | %b4 | È | %c8 |
‹ | %8b | ¢ | %a2 | µ | %b5 | É | %c9 |
Œ | %8c | £ | %a3 | ¶ | %b6 | Ê | %ca |
Ž | %8e | ¤ | %a4 | · | %b7 | Ë | %cb |
‘ | %91 | ¥ | %a5 | ¸ | %b8 | Ì | %cc |
’ | %92 | ¦ | %a6 | ¹ | %b9 | Í | %cd |
“ | %93 | § | %a7 | º | %ba | Î | %ce |
” | %94 | ¨ | %a8 | » | %bb | Ï | %cf |
• | %95 | © | %a9 | ¼ | %bc | Ð | %d0 |
– | %96 | — | %97 | ½ | %bd | Ñ | %d1 |
ã | %e3 | Þ | %de | ¾ | %be | Ò | %d2 |
æ | %e6 | ß | %df | Ø | %d8 | Ó | %d3 |
ä | %e4 | à | %e0 | Ý | %dd | Ô | %d4 |
Voici le tableau utilisé pour l'encodage des caractères Ascii.
ASCII Character | URL-Encoding |
NUL – null character | %00 |
SOH – the start of the header | %01 |
STX – the start of the text | %02 |
ETX – end of the text | %03 |
EOT – end of the transmission | %04 |
ENQ – enquiry | %05 |
ACK – acknowledge | %06 |
BEL – bell (ring) | %07 |
BS – backspace | %08 |
HT- horizontal tab | %09 |
LF- line feed | %0A |
VT- vertical tab | %0B |
FF- form feed | %0C |
CR- carriage return | %0D |
SO- shift out | %0E |
SI- shift in | %0F |
DLE- data link escape | %10 |
DC1- device control 1 | %11 |
DC2- device control 2 | %12 |
DC3- device control 3 | %13 |
DC4- device control 4 | %14 |
NAK- negative acknowledge | %15 |
SYN- synchronize | %16 |
ETB- end transmission block | %17 |
CAN- cancel | %18 |
EM – end of medium | %19 |
SUB- substitute | %1A |
ESC- escape | %1B |
FS -file separator | %1C |
GS- group separator | %1D |
RS- record separator | %1E |
US- unit separator | %1F |
Si l'URL est réservée, non sécurisée et non en caractères ASCII, l'adresse URL devient plus compliquée et incompréhensible. Lorsqu'un navigateur Web recherche des adresses URL, le serveur Web recherche le nom ou le chemin de l'URL. Si le nom de l'URL n'est pas ASCII, il est difficile de trouver l'importance du codage d'URL en HTML.
L'adresse URL doit être facile à trouver, universellement acceptée et compréhensible pour tous les navigateurs et serveurs Web. Certains caractères comprennent mal l'URL car ils sont utilisés dans un certain but s'ils ne sont utilisés à aucune fin. Ce conflit de temps a pu se produire et le chemin n'atteint pas l'utilisateur.
Pour surmonter toutes les difficultés et faciliter l'utilisation de caractères non-ASCII convertis en code ASCII en utilisant % pour obtenir deux hexadécimaux.
Le codage d'URL en HTML sait comment convertir le jeu de caractères non-ASCII en un jeu de format ASCII valide. Il est universellement accepté et un navigateur Web fonctionne sans aucune erreur. L’encodage des URL peut être exécuté rapidement et en toute sécurité. Pour éviter tout conflit entre le nom et le but du nom, le codage d'URL est nécessaire.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!