Maison > développement back-end > Golang > code tronqué intégré dans Golang

code tronqué intégré dans Golang

王林
Libérer: 2023-05-19 11:43:37
original
477 Les gens l'ont consulté

Lors de l'écriture de programmes Golang, vous devrez peut-être intégrer certains caractères non-ASCII, tels que du texte chinois, des expressions Emoji, etc. Cependant, parfois, les caractères intégrés apparaîtront tronqués, affectant l'effet de fonctionnement et la lisibilité du programme. Ce qui suit présente quelques causes courantes et solutions aux caractères tronqués intégrés à Golang.

1. Encodage de chaîne Golang

Une chaîne en Golang est une séquence composée de caractères Unicode. Chaque caractère occupe 1 ou 2 octets, selon sa méthode d'encodage. Golang prend en charge les trois méthodes de codage de caractères suivantes :

  1. Codage UTF-8

UTF-8 est un codage Unicode de longueur variable. Chaque caractère occupe 1 à 4 octets et la longueur spécifique dépend de la valeur codée Unicode. . Dans Golang, les chaînes sont codées en UTF-8 par défaut. Par exemple :

s := "你好"
Copier après la connexion

La chaîne s ci-dessus utilise le codage UTF-8.

  1. Encodage UTF-16

UTF-16 est un encodage Unicode de longueur fixe qui occupe 2 octets par caractère. Dans Golang, vous pouvez utiliser le type rune pour représenter les caractères codés en UTF-16. Par exemple :

var r rune = '好'
Copier après la connexion

Le code ci-dessus représente l'encodage UTF-16 du caractère « good », qui est un entier de type uint16.

  1. Encodage UTF-32

UTF-32 est un encodage Unicode de longueur fixe qui occupe 4 octets par caractère. Dans Golang, vous pouvez utiliser le type int32 pour représenter les caractères codés en UTF-32. Par exemple :

var c int32 = '?'
Copier après la connexion

Le code ci-dessus représente le codage UTF-32 de l'expression Emoji ?, qui est un entier de type uint32.

2. Méthodes d'intégration de caractères non-ASCII

Dans Golang, il existe quatre façons d'incorporer des caractères non-ASCII :

  1. Utilisation directe de caractères

Utilisation directe de caractères pour représenter des codes non-ASCII dans des chaînes de caractères. . Par exemple :

s := "你好?"
Copier après la connexion

Le code ci-dessus contient à la fois des caractères chinois et une expression Emoji.

  1. Caractères d'échappement

Utilisez des caractères d'échappement pour représenter des caractères non-ASCII. Par exemple :

s := "你好U0001F60A"
Copier après la connexion

Dans le code ci-dessus, U est suivi de l'encodage UTF-32 du caractère, qui représente une expression Emoji.

  1. Utilisez des valeurs codées Unicode

Utilisez des valeurs codées Unicode pour représenter des caractères non-ASCII. Par exemple :

s := "u4f60u597dU0001F60A"
Copier après la connexion

Dans le code ci-dessus, u est suivi de l'encodage UTF-16 du caractère et U est suivi de l'encodage UTF-32.

  1. Utilisez l'encodage base64

pour encoder en base64 les caractères non-ASCII, puis intégrez la chaîne codée dans le programme. Par exemple :

s := "5L2g5aW98J+YqA=="
Copier après la connexion

La chaîne ci-dessus est le résultat de l'encodage base64 de "Bonjour ?"

3. Causes et solutions aux caractères tronqués intégrés dans Golang

  1. Utilisation d'une mauvaise méthode d'encodage

Si une mauvaise méthode d'encodage est utilisée dans le programme, la chaîne contiendra des caractères tronqués. Par exemple, lors de l'utilisation de valeurs codées Unicode, si la mauvaise méthode de codage est utilisée, des caractères tronqués apparaîtront. La bonne façon de l'utiliser est d'utiliser le codage correct du caractère à échapper. Par exemple :

s := "u4f60u597dud83dude0a"
Copier après la connexion

Dans le code ci-dessus, u est suivi de l'encodage UTF-16 et ud83dude0a est la représentation correcte de l'encodage UTF-16 pour les expressions Emoji.

  1. L'éditeur provoque des caractères tronqués lors de l'enregistrement des fichiers

Certains éditeurs modifieront l'encodage du fichier lors de l'enregistrement du fichier, comme la conversion de l'encodage UTF-8 en ANSI. Cela entraînera des chaînes tronquées dans le programme. Par conséquent, vous devez enregistrer le fichier à l'aide d'un éditeur prenant en charge le codage UTF-8 et vous assurer que le codage du fichier est cohérent avec celui utilisé dans le programme.

  1. Paramètre incorrect des variables d'environnement système

Dans certains cas, les variables d'environnement du système peuvent affecter l'encodage de la chaîne dans le programme. Vous devez vérifier si la variable d'environnement système est correctement définie sur la méthode de codage.

En bref, lors de l'intégration de caractères non-ASCII, vous devez choisir correctement la méthode d'encodage et vous assurer que la méthode d'encodage du fichier est cohérente avec la méthode d'encodage du programme. Utilisez des méthodes d'échappement correctes pour éviter les caractères tronqués.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal