Heim > Backend-Entwicklung > Golang > Wie kann ich ungültige UTF-8-Zeichen in Go entfernen?

Wie kann ich ungültige UTF-8-Zeichen in Go entfernen?

Patricia Arquette
Freigeben: 2024-12-14 16:10:17
Original
195 Leute haben es durchsucht

How Can I Remove Invalid UTF-8 Characters in Go?

Ungültige UTF-8-Zeichen in Go entfernen

Bei der Arbeit mit JSON-Daten kann es vorkommen, dass ungültige UTF-8-Zeichen auftreten, was zu Fehlern beim Marshaling führt. Dieses Problem entsteht durch das Vorhandensein von Bytes, die nicht der UTF-8-Kodierung entsprechen.

Umgang mit ungültigen UTF-8-Zeichen

In Go können Sie dieses Problem beheben, indem Sie oder entfernen Ersetzen ungültiger Zeichen mit verschiedenen Ansätzen:

Go 1.13

strings.ToValidUTF8("a\xc5z", "")
Nach dem Login kopieren

Go 1.11

fixUtf := func(r rune) rune {
    if r == utf8.RuneError {
        return -1
    }
    return r
}

fmt.Println(strings.Map(fixUtf, "a\xc5z"))
fmt.Println(strings.Map(fixUtf, "posic�o"))
Nach dem Login kopieren

Diese Funktion entfernt alle ungültigen UTF-8-Zeichen, indem sie sie einem negativen Wert zuordnet, was zur erwarteten Ausgabe führt:

az
posico
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie kann ich ungültige UTF-8-Zeichen in Go entfernen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage