Inhaltsverzeichnis
3.2、使用unicode/utf16库进行字节序转换
3.3、使用golang.org/x/text库进行编码格式转换
4、小结
Heim Backend-Entwicklung Golang Was soll ich tun, wenn Golang verstümmelte Dateien liest?

Was soll ich tun, wenn Golang verstümmelte Dateien liest?

Apr 25, 2023 am 09:11 AM

Man kann sagen, dass Golang als Entwicklungssprache in Bezug auf das Lesen und Schreiben von Dateien relativ praktisch ist, bei der tatsächlichen Entwicklung treten jedoch immer noch einige Probleme auf, z. B. verstümmelte Zeichen nach dem Lesen der Datei. In diesem Artikel werden die Gründe und Lösungen für das Lesen verstümmelter Dateien in Golang vorgestellt.

1. Problemhintergrund

Wenn wir Golang zum Lesen von Dateien verwenden, ist der Inhalt nach dem Lesen manchmal verstümmelt, wie in der Abbildung unten gezeigt:

Was soll ich tun, wenn Golang verstümmelte Dateien liest?

2 Ursache des Problems

Die Gründe für verstümmelte Zeichen sind: Viele, die folgenden sind einige häufige Situationen:

2.1. Dateikodierungsformat stimmt nicht überein

Das Dateikodierungsformat bezieht sich auf das Kodierungsformat des Dateiinhalts, wenn er gespeichert wird, nicht auf die Erweiterung. Wenn Golang Dateien liest, werden sie standardmäßig im UTF-8-Kodierungsformat gelesen. Wenn die gelesene Datei nicht im UTF-8-Kodierungsformat vorliegt, werden verstümmelte Zeichen angezeigt.

Zum Beispiel können wir über das cmd-Befehlszeilentool des Windows-Systems eine TXT-Textdatei erstellen und diese im Codierungsformat „gbk“ speichern, wie in der Abbildung unten gezeigt:

Was soll ich tun, wenn Golang verstümmelte Dateien liest?

Dann verwenden wir Golang-Programm zum Lesen, wie in der folgenden Abbildung gezeigt:

Was soll ich tun, wenn Golang verstümmelte Dateien liest?

Es kann festgestellt werden, dass der Inhalt der gelesenen Datei verstümmelt ist. Dies liegt daran, dass das Standardcodierungsformat von Golang UTF-8 ist.

2.2. Endianness wird nicht korrekt gehandhabt

Wenn in Golang das Codierungsformat UTF-16 (einschließlich UTF-16LE und UTF-16BE) ist, muss die Endianness korrekt gehandhabt werden. UTF-16LE bedeutet, dass im Speicher niederwertige Bytes vorne und höherwertige Bytes hinten gespeichert werden, während UTF-16BE das Gegenteil ist.

Was soll ich tun, wenn Golang verstümmelte Dateien liest?

Wenn wir beim Lesen von UTF-16-Dateien die Bytereihenfolge nicht richtig handhaben, werden verstümmelte Zeichen angezeigt.

2.3. Andere Probleme bei der Konvertierung von Codierungsformaten

Manchmal müssen wir möglicherweise Dateien in anderen Formaten (wie CSV, XML usw.) zum Lesen in von Golang unterstützte Formate konvertieren, aber während der Konvertierung kann es zu Problemen mit der Konvertierung des Codierungsformats kommen führt zu verstümmelten Zeichen.

3. Lösung

Für die oben genannten Situationen können wir die folgenden Lösungen wählen:

3.1. Bestätigen Sie das Dateikodierungsformat und lesen Sie es.

Wenn wir das Kodierungsformat der Datei bereits kennen, müssen wir die Datei lesen Bei Angabe des entsprechenden Kodierungsformats.

golang bietet eine ReadFile-Methode des ioutil-Pakets, mit der Dateien sehr bequem gelesen werden können. Wenn Sie diese Methode verwenden, können Sie das Dateikodierungsformat über Methoden wie bufio.NewReader und ioutil.NopCloser angeben. Der Code lautet wie folgt:

func ReadFileWithCharset(filename string, charset string) ([]byte, error) {
    f, err := os.Open(filename)
    if err != nil {
        return nil, err
    }
    defer f.Close()

    r, err := charset.NewReader(f)
    if err != nil {
        return nil, err
    }
    defer r.Close()

    return ioutil.ReadAll(r)
}
Nach dem Login kopieren
ioutil包的ReadFile方法,可以非常方便地进行文件读取。在使用该方法时,可以通过bufio.NewReaderioutil.NopCloser等方法指定文件编码格式,代码如下所示:
package main

import (
    "fmt"
    "io/ioutil"
    "unicode/utf16"
)

func readUTF16File(filename string) ([]byte, error) {
    data, err := ioutil.ReadFile(filename)
    if err != nil {
        return nil, err
    }

    u := utf16.Decode(data)

    return []byte(string(u)), nil
}

func main() {
    data, _ := readUTF16File("test.txt")
    fmt.Println(string(data))
}
Nach dem Login kopieren

其中charset.NewReader方法会根据指定的编码格式生成一个新的ReadCloser对象,使用该对象进行文件读取即可。

3.2、使用unicode/utf16库进行字节序转换

在使用unicode/utf16库时,需要注意该库中最大长度为32767字节,如果文件大小超过该限制,则需要进行分段读取。

代码示例:

package main

import(
    "fmt"
    "io/ioutil"
    "golang.org/x/text/encoding/charmap"
)

func ReadFileWithCharset(filename string, charset string) ([]byte, error) {
    data, err := ioutil.ReadFile(filename)
    if err != nil {
        return nil, err
    }

    charmap := charmap.Windows1252.NewDecoder()

    return charmap.Bytes(data)
}

func main() {
    data,_:=ReadFileWithCharset("test.txt","UTF-8")
    fmt.Println(string(data))
}
Nach dem Login kopieren

3.3、使用golang.org/x/text库进行编码格式转换

golang.org/x/text库提供了非常详细的编码格式转换功能,可以解决绝大部分和编码格式相关的问题。

代码示例:

rrreee

4、小结

乱码问题是开发中非常常见的问题,而在golang中,应该根据具体情况选择解决方法。如果文件编码格式确定,则应该在文件读取过程中指定相应的编码格式;如果涉及到字节序问题,则需要使用unicode/utf16库进行字节序转换;而对于其他编码格式转换问题,则可以使用golang.org/x/textwobei charset. Die NewReader-Methode generiert ein neues ReadCloser-Objekt gemäß dem angegebenen Codierungsformat und verwendet dieses Objekt zum Lesen der Datei.

🎜3.2. Verwenden Sie die Bibliothek unicode/utf16 für die Konvertierung der Bytereihenfolge. 🎜🎜Bei Verwendung der Bibliothek unicode/utf16 müssen Sie beachten, dass die maximale Länge in der Bibliothek beträgt 32767 Bytes. Wenn die Dateigröße diesen Grenzwert überschreitet, ist segmentiertes Lesen erforderlich. 🎜🎜Codebeispiel: 🎜rrreee🎜3.3. Verwenden Sie die golang.org/x/text-Bibliothek für die Kodierungsformatkonvertierung🎜🎜golang.org/x/text-Bibliothek bietet sehr viel Eine detaillierte Funktion zur Konvertierung des Kodierungsformats kann die meisten Probleme im Zusammenhang mit dem Kodierungsformat lösen. 🎜🎜Codebeispiel: 🎜rrreee🎜4. Das Problem mit verstümmeltem Code ist ein sehr häufiges Problem in der Entwicklung, und in Golang sollte die Lösung entsprechend der spezifischen Situation ausgewählt werden. Wenn das Dateikodierungsformat bestimmt ist, sollte das entsprechende Kodierungsformat während des Dateilesevorgangs angegeben werden. Wenn Probleme mit der Bytereihenfolge auftreten, müssen Sie die Bibliothek unicode/utf16 für die Konvertierung der Bytereihenfolge verwenden Für andere Probleme bei der Konvertierung von Codierungsformaten können Sie die Bibliothek golang.org/x/text zur Konvertierung verwenden. Durch die oben genannten Methoden kann das Problem des Lesens verstümmelter Zeichen in Golang-Dateien effektiv gelöst und die Entwicklungseffizienz verbessert werden. 🎜

Das obige ist der detaillierte Inhalt vonWas soll ich tun, wenn Golang verstümmelte Dateien liest?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Was sind die Schwachstellen von Debian Openensl Was sind die Schwachstellen von Debian Openensl Apr 02, 2025 am 07:30 AM

OpenSSL bietet als Open -Source -Bibliothek, die in der sicheren Kommunikation weit verbreitet sind, Verschlüsselungsalgorithmen, Tasten und Zertifikatverwaltungsfunktionen. In seiner historischen Version sind jedoch einige Sicherheitslücken bekannt, von denen einige äußerst schädlich sind. Dieser Artikel konzentriert sich auf gemeinsame Schwachstellen und Antwortmaßnahmen für OpenSSL in Debian -Systemen. DebianopensL Bekannte Schwachstellen: OpenSSL hat mehrere schwerwiegende Schwachstellen erlebt, wie z. Ein Angreifer kann diese Sicherheitsanfälligkeit für nicht autorisierte Lesen sensibler Informationen auf dem Server verwenden, einschließlich Verschlüsselungsschlüssel usw.

Wie verwenden Sie das PPROF -Tool, um die Go -Leistung zu analysieren? Wie verwenden Sie das PPROF -Tool, um die Go -Leistung zu analysieren? Mar 21, 2025 pm 06:37 PM

In dem Artikel wird erläutert, wie das PPROF -Tool zur Analyse der GO -Leistung verwendet wird, einschließlich der Aktivierung des Profils, des Sammelns von Daten und der Identifizierung gängiger Engpässe wie CPU- und Speicherprobleme.Character Count: 159

Wie schreibt man Unit -Tests in Go? Wie schreibt man Unit -Tests in Go? Mar 21, 2025 pm 06:34 PM

In dem Artikel werden Schreiben von Unit -Tests in GO erörtert, die Best Practices, Spottechniken und Tools für ein effizientes Testmanagement abdecken.

Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Apr 02, 2025 pm 02:06 PM

In der Bibliothek, die für den Betrieb der Schwimmpunktnummer in der GO-Sprache verwendet wird, wird die Genauigkeit sichergestellt, wie die Genauigkeit ...

Was ist das Problem mit Warteschlangen -Thread in Go's Crawler Colly? Was ist das Problem mit Warteschlangen -Thread in Go's Crawler Colly? Apr 02, 2025 pm 02:09 PM

Das Problem der Warteschlange Threading In Go Crawler Colly untersucht das Problem der Verwendung der Colly Crawler Library in Go -Sprache. Entwickler stoßen häufig auf Probleme mit Threads und Anfordern von Warteschlangen. � ...

Wie geben Sie Abhängigkeiten in Ihrer Go.Mod -Datei an? Wie geben Sie Abhängigkeiten in Ihrer Go.Mod -Datei an? Mar 27, 2025 pm 07:14 PM

In dem Artikel werden die Verwaltungs -Go -Modulabhängigkeiten über Go.mod erörtert, die Spezifikationen, Aktualisierungen und Konfliktlösung abdecken. Es betont Best Practices wie semantische Versioning und reguläre Updates.

Wie verwenden Sie tabelgesteuerte Tests in Go? Wie verwenden Sie tabelgesteuerte Tests in Go? Mar 21, 2025 pm 06:35 PM

In dem Artikel werden mit Tabellensteuerungstests in GO eine Methode mit einer Tabelle mit Testfällen getestet, um Funktionen mit mehreren Eingaben und Ergebnissen zu testen. Es zeigt Vorteile wie eine verbesserte Lesbarkeit, verringerte Vervielfältigung, Skalierbarkeit, Konsistenz und a

Ist es vielversprechender, Java oder Golang von Front-End zu Back-End-Entwicklung zu verwandeln? Ist es vielversprechender, Java oder Golang von Front-End zu Back-End-Entwicklung zu verwandeln? Apr 02, 2025 am 09:12 AM

Backend Learning Path: Die Erkundungsreise von Front-End zu Back-End als Back-End-Anfänger, der sich von der Front-End-Entwicklung verwandelt, Sie haben bereits die Grundlage von Nodejs, ...

See all articles