UTF-8 est défini comme l'encodage de caractères par défaut pour HTML5 utilisé pour afficher parfaitement une page HTML. Il encourage les développeurs Web à utiliser UTF-8 car il couvre tous les caractères et symboles de l'entité qui utilise un octet et fonctionne bien dans tous les navigateurs. Format de transformation Unicode – 8 bits est une méthode qui convertit les caractères saisis en code lisible par machine. L'attribut charset est utilisé pour effectuer un encodage de caractères pour le HTML.
Syntaxe de UTF-8 en HTML
Spécification du codage des caractères UTF-8 dans le fichier le tag est donné comme :
<meta charset="UTF-8">
Ici, la méta donne des données sur le document HTML mais est lisible par machine. Et leurs éléments spécifient un mot-clé, la dernière modification, etc. Cette balise méta contient le jeu de caractères, qui informe le navigateur Web lors de l'accès à la page.
Le codage est la façon dont les nombres donnés sont convertis en nombres binaires, ce qu'une machine a compris. Ici, chaque caractère est composé respectivement d'un ou plusieurs octets.
A titre d'exemple, prenons le texte Salut, EDUCBA !
L'encodage des caractères UTF-8 est indiqué ci-dessous :
01001000 01101001 00101100 01100101 01000100 01010101 01000011 01000010 01000001 00100001
Qui se convertit en une structure binaire lisible par machine.
Ensuite, nous verrons en quoi la représentation Unicode est importante lors de l'intégration des langues étrangères dans le contenu.
Vous trouverez ci-dessous les exemples d'UTF-8 en HTML :
Exemple simple avec le contenu du paragraphe.
Code :
nouveau.html
<meta charset="UTF-8">Page Title !مرحبا بالعالم
你叫什么名字?
This is Chinese Language.
This is the code demonstrating encoding Process
Explication :
Sortie :
Utilisation des boutons pour le texte de saisie.
Code :
lang.html
<!DOCTYPE HTML > <html> <head> <title>HTML sample -buttons</title> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> </head> <body> <form action="addressing" method="post"> <fieldset> <legend>Selection list</legend> Checkbox: <input type="checkbox" name="King" value="one"><br> RadioButton1: <input type="radio" name="Queen" value="two"><br> RadioButton2: <input type="radio" name="Jack" value="three" checked="checked"><br> </fieldset> <fieldset> <legend>Give Input</legend> Login Id: <input type="text" name="Login name"><br> Password: <input type="password" name="Strong Password"><br> </fieldset> <fieldset> <legend>Designation</legend> <p><input type="checkbox" name=" Software Engineer"> Software Engineer</p> <p><input type="checkbox" name="Data Analyst"> Data Analyst</p> <p><input type="checkbox" name="Web Developer"> Web Developer</p> <p><input type="checkbox" name=" Senior Analyst"> Senior Analyst</p> </fieldset> <p><input type="submit" value="press"> <input type="reset"></p> </form> </body> </html>
Explication :
Sortie :
Code utilisant un contenu en langue étrangère.
Code :
mett.html
<!DOCTYPE html> <html> <head> <title> HTML UTF-8 Charset </title> <meta name="keywords" charset="UTF-8" content="Meta Tags, Metadata" /> </head> <body style="text-align:left"> <H1>Hi Instructor!</H1> <h2> This is my formal e-mail for the joining. </h2> <h3>Hola, me llamo Juan </h3> <b>Mucho gusto </b> </body> </html>
Explication :
Sortie :
Using JavaScript.
Code:
name.js
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>UTF-8 Charset</title> <style> span { color: blue; } span.name { color: red; font-weight: bolder; } </style> <script src="https://code.jquery.com/jquery-3.5.0.js"></script> </head> <body> <div> <span>Thomas,</span> <span>John Betson,</span> <span>Valli Tromson</span> </div> <div> <span>आभरणा,</span> <span>आचुथान,</span> <span>अभिनंध</span> </div> <script> $( "div span:first-child" ) .css( "text-decoration", "Underline" ) .hover(function() { $( this ).addClass( "name" ); }); </script> </body> </html>
Explanation:
Output:
So that’s all about the encoding of UTF-8 in HTML. We have gone through Unicode and encodes in the HTML briefly and the implementation of HTML and JavaScript. In this emerging software world, the character sets are not made so feasible; therefore, there comes character encoding schemes to be done with the HTML and other programming languages. Therefore, it is said that it is best to use UTF-8 everywhere where it doesn’t need any conversions encoding.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!