Heim > Backend-Entwicklung > Golang > Golang eingebetteter verstümmelter Code

Golang eingebetteter verstümmelter Code

王林
Freigeben: 2023-05-19 11:43:37
Original
479 Leute haben es durchsucht

Beim Schreiben von Golang-Programmen müssen Sie möglicherweise einige Nicht-ASCII-Zeichen einbetten, z. B. chinesischen Text, Emoji-Ausdrücke usw. Manchmal erscheinen die eingebetteten Zeichen jedoch verstümmelt, was die Ausführungswirkung und die Lesbarkeit des Programms beeinträchtigt. Im Folgenden werden einige häufige Ursachen und Lösungen für in Golang eingebettete verstümmelte Zeichen vorgestellt.

1. Golang-String-Kodierung

Eine Zeichenfolge in Golang ist eine Sequenz, die aus Unicode-Zeichen besteht. Jedes Zeichen belegt je nach Codierungsmethode 1 oder 2 Bytes. Golang unterstützt die folgenden drei Zeichenkodierungsmethoden:

  1. UTF-8-Kodierung

UTF-8 ist eine Unicode-Kodierung mit variabler Länge. Jedes Zeichen belegt 1-4 Bytes, und die spezifische Länge hängt vom kodierten Wert des Zeichens ab . In Golang werden Zeichenfolgen standardmäßig in UTF-8 codiert. Zum Beispiel:

s := "你好"
Nach dem Login kopieren

Die obige Zeichenfolge verwendet die UTF-8-Kodierung.

  1. UTF-16-Kodierung

UTF-16 ist eine Unicode-Kodierung mit fester Länge, die 2 Bytes pro Zeichen benötigt. In Golang können Sie den Rune-Typ verwenden, um UTF-16-codierte Zeichen darzustellen. Zum Beispiel:

var r rune = '好'
Nach dem Login kopieren

Der obige Code stellt die UTF-16-Codierung des Zeichens „good“ dar, bei dem es sich um eine Ganzzahl vom Typ uint16 handelt.

  1. UTF-32-Kodierung

UTF-32 ist eine Unicode-Kodierung fester Länge, die 4 Bytes pro Zeichen benötigt. In Golang können Sie den Typ int32 verwenden, um UTF-32-codierte Zeichen darzustellen. Zum Beispiel:

var c int32 = '?'
Nach dem Login kopieren

Der obige Code stellt die UTF-32-Kodierung des Emoji-Ausdrucks ? dar, der eine Ganzzahl vom Typ uint32 ist.

2. Methoden zum Einbetten von Nicht-ASCII-Zeichen

In Golang gibt es vier Möglichkeiten, Nicht-ASCII-Zeichen einzubetten:

  1. Direkte Verwendung von Zeichen

Direkte Verwendung von Zeichen zur Darstellung von Nicht-ASCII-Codes in Zeichenketten . Zum Beispiel:

s := "你好?"
Nach dem Login kopieren

Der obige Code enthält sowohl chinesische Schriftzeichen als auch einen Emoji-Ausdruck.

  1. Escape-Zeichen

Verwenden Sie Escape-Zeichen, um Nicht-ASCII-Zeichen darzustellen. Beispiel:

s := "你好U0001F60A"
Nach dem Login kopieren

Im obigen Code folgt auf U die UTF-32-Kodierung des Zeichens, das einen Emoji-Ausdruck darstellt.

  1. Verwenden Sie Unicode-codierte Werte.

Verwenden Sie Unicode-codierte Werte, um Nicht-ASCII-Zeichen darzustellen. Beispiel:

s := "u4f60u597dU0001F60A"
Nach dem Login kopieren

Im obigen Code folgt auf u die UTF-16-Kodierung des Zeichens und auf U die UTF-32-Kodierung.

  1. Verwenden Sie die Base64-Kodierung

, um Nicht-ASCII-Zeichen mit Base64 zu kodieren, und betten Sie dann die kodierte Zeichenfolge in das Programm ein. Zum Beispiel:

s := "5L2g5aW98J+YqA=="
Nach dem Login kopieren

Die obige Zeichenfolge ist das Base64-Codierungsergebnis von „Hallo?“

3. Ursachen und Lösungen für in Golang eingebettete verstümmelte Zeichen

  1. Verwendung der falschen Codierungsmethode

Wenn im Programm die falsche Codierungsmethode verwendet wird, enthält die Zeichenfolge verstümmelte Zeichen. Wenn beispielsweise Unicode-codierte Werte verwendet werden und die falsche Codierungsmethode verwendet wird, werden verstümmelte Zeichen angezeigt. Die richtige Verwendung besteht darin, die richtige Kodierung des zu maskierenden Zeichens zu verwenden. Zum Beispiel:

s := "u4f60u597dud83dude0a"
Nach dem Login kopieren

Im obigen Code folgt auf u die UTF-16-Kodierung, und ud83dude0a ist die korrekte Darstellung der UTF-16-Kodierung für Emoji-Ausdrücke.

  1. Der Editor verursacht beim Speichern von Dateien verstümmelte Zeichen.

Einige Editoren ändern die Kodierung der Datei beim Speichern der Datei, z. B. die Konvertierung von UTF-8 in die ANSI-Kodierung. Dies führt dazu, dass die Zeichenfolgen im Programm verstümmelt werden. Daher sollten Sie die Datei mit einem Editor speichern, der die UTF-8-Kodierung unterstützt, und sicherstellen, dass die Dateikodierung mit der im Programm verwendeten Kodierung übereinstimmt.

  1. Falsche Einstellung der Systemumgebungsvariablen

In einigen Fällen können sich die Umgebungsvariablen des Systems auf die Zeichenfolgenkodierung im Programm auswirken. Sie müssen überprüfen, ob die Systemumgebungsvariable korrekt auf die Kodierungsmethode eingestellt ist.

Kurz gesagt, beim Einbetten von Nicht-ASCII-Zeichen müssen Sie die Kodierungsmethode richtig auswählen und sicherstellen, dass die Kodierungsmethode der Datei mit der Kodierungsmethode im Programm übereinstimmt. Verwenden Sie die richtigen Escape-Methoden, um verstümmelte Zeichen zu vermeiden.

Das obige ist der detaillierte Inhalt vonGolang eingebetteter verstümmelter Code. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage