Avec le développement rapide d'Internet, de plus en plus de sites Web commencent à utiliser le codage Unicode (tel que UTF-8, etc.) pour représenter du texte. Mais en Chine, l’encodage GBK reste une méthode d’encodage de caractères courante, notamment sur certains anciens sites Web. Pour les ingénieurs front-end, il est indispensable de comprendre comment gérer le texte tronqué codé par GBK. Dans cet article, nous présenterons plusieurs méthodes de gestion du codage GBK en JavaScript et donnerons des exemples de codes correspondants.
1. Introduction au codage GBK
Le codage GBK est une méthode de codage de caractères sur deux octets qui utilise 2 octets pour représenter un caractère. Il est généralement utilisé pour représenter des caractères et des symboles chinois. Selon la norme nationale chinoise GB2312, le codage GBK contient le jeu de caractères GB2312 ainsi qu'un grand nombre de caractères et de symboles chinois.
2. Problèmes avec l'encodage GBK
Étant donné que l'encodage GBK est incompatible avec l'encodage Unicode, si le texte encodé GBK est traité directement en JavaScript, des caractères tronqués apparaîtront, comme le montre la figure ci-dessous :
3. l'encodage est un encodage Unicode
Afin de résoudre le problème du code tronqué, nous devons convertir l'encodage GBK en encodage Unicode. En JavaScript, nous pouvons utiliser une bibliothèque appelée « GBK » pour effectuer la conversion.
Tout d'abord, nous devons installer la bibliothèque 'GBK', l'installation peut être effectuée dans la console avec la commande suivante :
npm install gbk
Une fois l'installation terminée, nous pouvons utiliser le code suivant pour convertir la chaîne encodée GBK en un Chaîne codée Unicode :
const gbk = require('gbk'); const gbkStr = 'GBK编码字符串'; const unicodeStr = gbk.toString('ucs2', gbkStr); console.log(unicodeStr);
In Dans le code ci-dessus, nous introduisons d'abord l'objet 'gbk' via la bibliothèque 'GBK', puis définissons une chaîne codée GBK 'gbkStr', et enfin utilisons la méthode 'gbk.toString' pour convertir dans une chaîne codée Unicode et affichez le résultat.
4. Convertir l'encodage Unicode en encodage GBK
La conversion de l'encodage Unicode en encodage GBK nécessite également l'utilisation de la bibliothèque 'GBK' L'exemple de code est le suivant :
const gbk = require('gbk'); const unicodeStr = 'Unicode编码字符串'; const gbkStr = gbk.toString('gbk', unicodeStr, 0); console.log(gbkStr);
Dans le code ci-dessus, nous l'introduisons également via le. L'objet gbk de la bibliothèque 'GBK', définit une chaîne codée Unicode 'unicodeStr' et utilise enfin la méthode 'gbk.toString' pour la convertir en une chaîne codée GBK et afficher le résultat.
5. Utilisez la bibliothèque iconv-lite
En plus de la bibliothèque 'GBK', nous pouvons également utiliser une autre bibliothèque appelée 'iconv-lite' pour convertir l'encodage GBK. La bibliothèque 'iconv-lite' supporte nativement l'encodage GBK, elle peut donc être utilisée directement.
Ce qui suit est un exemple de code pour convertir une chaîne codée GBK en chaîne codée Unicode :
const iconv = require('iconv-lite'); const gbkStr = 'GBK编码字符串'; const unicodeStr = iconv.decode(Buffer.from(gbkStr, 'binary'), 'gbk'); console.log(unicodeStr);
Dans le code ci-dessus, nous introduisons d'abord l'objet 'iconv' via la bibliothèque 'iconv-lite', puis définissons un GBK Chaîne de caractères codée 'gbkStr', et enfin utilisez la méthode 'iconv.decode' pour la convertir en une chaîne codée Unicode et afficher le résultat.
De même, nous pouvons également utiliser la bibliothèque 'iconv-lite' pour convertir les chaînes codées Unicode en chaînes codées GBK. L'exemple de code est le suivant :
const iconv = require('iconv-lite'); const unicodeStr = 'Unicode编码字符串'; const gbkStr = iconv.encode(unicodeStr, 'gbk').toString('binary'); console.log(gbkStr);
Dans le code ci-dessus, nous l'introduisons également via 'iconv-lite. ' bibliothèque L'objet 'iconv' définit une chaîne codée Unicode 'unicodeStr' et utilise enfin la méthode 'iconv.encode' pour la convertir en une chaîne codée GBK et afficher le résultat.
6. Résumé
Ci-dessus, il existe plusieurs façons de gérer l'encodage GBK en JavaScript. Bien que de nombreux sites Web aient progressivement adopté le codage Unicode, il existe encore de nombreux anciens sites Web utilisant le codage GBK. Par conséquent, il est très nécessaire que les ingénieurs front-end maîtrisent la méthode de résolution des caractères tronqués de codage GBK.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!