Dans le fichier de code ascii, une lettre anglaise occupe un octet et un caractère chinois occupe deux octets d'espace ; le code ascii utilise une combinaison de nombres binaires spécifiée de 7 ou 8 bits pour représenter 128 ou 256 caractères possibles, et Un octet est l’unité de données binaires et un octet mesure généralement 8 bits.
L'environnement d'exploitation de cet article : système Windows 7, ordinateur Dell G3.
Combien d'octets une lettre anglaise occupe-t-elle dans le fichier de code ASCII ?
Dans le code ASCII, une lettre anglaise (quelle que soit la casse) occupe un octet d'espace et un caractère chinois occupe deux octets d'espace.
ASCII :
ASCII ((American Standard Code for Information Interchange) : American Standard Code for Information Interchange) est un système de codage informatique basé sur l'alphabet latin, principalement utilisé pour afficher l'anglais moderne et d'autres langues d'Europe occidentale. Il s’agit de la norme d’échange d’informations la plus courante et équivaut à la norme internationale ISO/IEC 646. ASCII a été publié pour la première fois en tant que type standardisé en 1967 et mis à jour pour la dernière fois en 1986. Jusqu'à présent, un total de 128 caractères ont été définis.
Le code ASCII utilise une combinaison de nombres binaires spécifiée de 7 ou 8 bits pour représenter 128 ou 256 caractères possibles. Le code ASCII standard, également appelé code ASCII de base, utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9, les signes de ponctuation et les contrôles spéciaux utilisés dans le caractère anglais américain[1] . Parmi eux :
0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spécifiques à la communication (les autres sont des caractères affichables), comme les caractères de contrôle : LF (saut de ligne), CR (retour chariot), FF ( saut de page), DEL (suppression), BS (retour arrière), BEL (anneau), etc. ; caractères spéciaux de communication : SOH (tête de texte), EOT (fin de texte), ACK (confirmation), etc. ; sont 8, 9, 10 et 13 Convertissez respectivement en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte en fonction des différentes applications [1] .
32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.
65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.
A noter également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. La parité impaire stipule : le nombre de 1 dans un octet du code correct doit être un nombre impair, si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. La parité stipule : le nombre de 1 dans un octet du code ; le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 au bit le plus élevé b7.
Les 128 derniers sont appelés codes ASCII étendus. De nombreux systèmes x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres en langue étrangère et des symboles graphiques.
Octet :
L'octet est l'unité de données binaires. Un octet fait généralement 8 bits. Cependant, certaines architectures informatiques plus anciennes utilisent des longueurs différentes. Pour éviter toute confusion, dans la plupart de la littérature internationale, le mot octet est utilisé à la place de octet. Dans la plupart des systèmes informatiques, un octet est une unité de données de 8 bits. La plupart des ordinateurs utilisent un octet pour représenter un caractère, un nombre ou un autre caractère. Un octet peut également représenter une série de bits binaires. Dans certains systèmes informatiques, 4 octets représentent un mot, qui est l'unité de données que l'ordinateur peut traiter efficacement lors de l'exécution d'instructions. Certaines descriptions de langage nécessitent 2 octets pour représenter un caractère, appelé jeu de caractères à deux octets. Certains processeurs sont capables de gérer des instructions codées sur deux octets ou sur un seul octet. Les octets sont souvent abrégés en « B » et les bits sont généralement abrégés en « b » minuscule. La taille de la mémoire de l'ordinateur est généralement exprimée en octets.
Pour plus de connaissances connexes, veuillez visiter la rubrique FAQ !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!