Quel est le codage des caractères ? Comment définir l'encodage des caractères en HTML5 ?-Tutoriel H5-php.cn

Quel est le codage des caractères ? Comment définir l'encodage des caractères en HTML5 ?

青灯夜游

Libérer： 2018-11-12 17:36:25

original

10187 Les gens l'ont consulté

Le contenu de cet article est de présenter ce qu'est le codage de caractères et comment définir le codage de caractères en html5 ; permettre à tout le monde de comprendre le rôle du codage de caractères et comment définir le codage de caractères en html5. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer. J'espère qu'il vous sera utile.

Tout d’abord, comprenons Quel est l’encodage des caractères ? A quoi ça sert ?

Le codage de caractères est une méthode de conversion d'octets en caractères. Pour valider ou afficher un document HTML, le programme doit sélectionner un encodage de caractères. Dans la page, nous pouvons définir le codage de "utf-8" pour éviter les caractères chinois tronqués. [Tutoriels vidéo associés recommandés : Tutoriel HTML5]

Il existe trois méthodes de définition du codage des caractères dans HTML 5 Présentons-les respectivement ci-dessous :

En-tête HTTP Content-Type

Si vous écrivez cgi ou un programme similaire, vous pouvez utiliser l'en-tête HTTP Content-Type pour définir n'importe quel codage de caractères.

Voici un exemple simple :

print "Content-Type: text/html; charset=utf-8\r\n";

Copier après la connexion

Élément

Vous pouvez utiliser l'élément meta> de l'attribut charset, qui peut spécifier l'encodage dans les 512 premiers octets du document HTML5. <;méta>Plus pratique.

Marque d'ordre d'octet (BOM) Unicode

<meta charset="UTF-8">

Copier après la connexion

<meta http-equiv =“Content-Type”content =“text / html; charset = UTF-8”>

Copier après la connexion

La marque d'ordre d'octet (BOM) est constituée du code de caractère U+FEFF au début de le flux de données, où il peut être utilisé comme signature définissant l'ordre des octets et la forme de codage des fichiers en texte brut, principalement non marqués.

De nombreux programmes Windows (y compris le Bloc-notes Windows) ajoutent les octets 0xEF, 0xBB, 0xBF au début de tout document enregistré au format UTF-8. Il s'agit du codage UTF-8 de la marque d'ordre des octets (BOM) Unicode, souvent appelée nomenclature UTF-8, même si cela n'a rien à voir avec l'ordre des octets.

Pour les documents HTML5, vous pouvez utiliser les caractères Unicode Byte Order Mark (BOM) au début du fichier. Ce caractère fournit la signature du codage utilisé. Résumé : ce qui précède représente l'intégralité du contenu de cet article. Vous pouvez choisir différentes méthodes pour définir le codage des caractères en fonction de différentes situations ; j'espère que cela sera utile à votre apprentissage.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!