Wie man mit chinesischem verstümmeltem Code in Golang Zip umgeht
Mit der Popularität der Golang-Sprache beginnen immer mehr Menschen, sie zur Entwicklung neuer Anwendungen zu nutzen. Eine der häufigsten Anwendungen besteht darin, Dateien aus dem Dateisystem zu packen und in eine ZIP-Datei zu komprimieren. Insbesondere beim Umgang mit chinesischen Dateinamen kann es leicht zu Problemen mit verstümmelten Zeichen kommen. In diesem Artikel wird erläutert, wie das Problem der verstümmelten chinesischen Zeichen in Golang Zip gelöst werden kann.
1. Problembeschreibung
Wenn der verarbeitete Dateiname chinesische Zeichen enthält, werden bei der Ausgabe in die ZIP-Datei verstümmelte Zeichen angezeigt. Das Bild unten zeigt eine Verzeichnisstruktur mit chinesischen Dateinamen:
example ├── file1.txt └── 文件2.txt
Wir verwenden den folgenden Code, um es in eine ZIP-Datei zu packen:
package main import ( "archive/zip" "os" "path/filepath" ) func main() { zipFileName := "example.zip" files := []string{"example/file1.txt", "example/文件2.txt"} // Create a new ZIP file. zipFile, err := os.Create(zipFileName) if err != nil { panic(err) } defer zipFile.Close() // Create a new writer to write to the ZIP file. zipWriter := zip.NewWriter(zipFile) defer zipWriter.Close() // Iterate over the files and add them to the ZIP file. for _, file := range files { addFileToZip(file, zipWriter) } } func addFileToZip(file string, zipWriter *zip.Writer) error { // Open the file to be added to the ZIP file. fileToZip, err := os.Open(file) if err != nil { return err } defer fileToZip.Close() // Get the file information for the file being added. fileInfo, err := fileToZip.Stat() if err != nil { return err } // Create a new file header for the file being added. header, err := zip.FileInfoHeader(fileInfo) if err != nil { return err } // Set the name for the file being added (this is what appears in the ZIP archive). header.Name = filepath.Base(file) // Add the file header to the ZIP archive. writer, err := zipWriter.CreateHeader(header) if err != nil { return err } // Copy the contents of the file into the ZIP archive. _, err = io.Copy(writer, fileToZip) if err != nil { return err } return nil }
Durch die Ausführung dieses Programms wird die Datei example.zip generiert. Öffnen Sie die komprimierte Datei, die wir sehen können Der Dateiname ist verstümmelt. Wie in der folgenden Abbildung gezeigt:
Dies liegt daran, dass das Programm beim Ausführen von zipWriter.CreateHeader (Header) standardmäßig die UTF-8-Codierung verwendet, um den Dateinamen zu verarbeiten, der Dateiname jedoch die Standardcodierung des Systems verwendet (in meinem Fall GBK in der Mitte). Daher wird es beim Schreiben der ZIP-Datei verstümmelt.
2. Lösung
Um das oben genannte Problem zu lösen, müssen wir sicherstellen, dass der Dateiname in die UTF-8-Kodierung konvertiert wird, bevor wir die ZIP-Datei schreiben. Der Dateiname kann jedoch mit der Standardkodierung des Systems generiert werden. Daher müssen wir sicherstellen, dass das Kodierungsformat des Dateinamens korrekt identifiziert und in die UTF-8-Kodierung konvertiert wird.
Das Folgende ist ein einfaches Beispiel, das zeigt, wie die obigen Schritte implementiert werden:
package main import ( "archive/zip" "bytes" "io" "os" "path/filepath" "golang.org/x/text/encoding/simplifiedchinese" "golang.org/x/text/transform" ) func main() { zipFileName := "example.zip" files := []string{"example/file1.txt", "example/文件2.txt"} // Create a new ZIP file. zipFile, err := os.Create(zipFileName) if err != nil { panic(err) } defer zipFile.Close() // Create a new writer to write to the ZIP file. zipWriter := zip.NewWriter(zipFile) defer zipWriter.Close() // Iterate over the files and add them to the ZIP file. for _, file := range files { addFileToZip(file, zipWriter) } } func addFileToZip(file string, zipWriter *zip.Writer) error { // Open the file to be added to the ZIP file. fileToZip, err := os.Open(file) if err != nil { return err } defer fileToZip.Close() // Get the file information for the file being added. fileInfo, err := fileToZip.Stat() if err != nil { return err } // Create a new file header for the file being added. header, err := zip.FileInfoHeader(fileInfo) if err != nil { return err } // Convert the file name to UTF-8. header.Name, err = toUTF8(fileInfo.Name()) if err != nil { return err } // Add the file header to the ZIP archive. writer, err := zipWriter.CreateHeader(header) if err != nil { return err } // Copy the contents of the file into the ZIP archive. _, err = io.Copy(writer, fileToZip) if err != nil { return err } return nil } func toUTF8(src string) (string, error) { var ( buf bytes.Buffer w = transform.NewWriter(&buf, simplifiedchinese.GBK.NewDecoder()) ) _, err := w.Write([]byte(src)) if err != nil { return "", err } err = w.Close() if err != nil { return "", err } return buf.String(), nil }
Im obigen Code verwenden wir das Paket golang.org/x/text/transform, um den Dateinamen vom GBK-Format in das UTF-8-Format zu konvertieren . Wir importieren zunächst das Paket und konvertieren den Dateinamen mithilfe der Funktion toUTF8() von GBK in die UTF-8-Kodierung. Dann aktualisieren wir in der Funktion addFileToZip() Header.Name mit dem konvertierten Dateinamen und fügen ihn der ZIP-Datei hinzu.
Führen Sie die von diesem Programm generierte ZIP-Datei aus und der Dateiname wird normalerweise auf Chinesisch angezeigt.
Zusammenfassung
Wenn Sie das Golang-Zip-Paket verwenden und ein chinesischer Dateiname vorhanden ist, werden Sie bei der Ausgabe in die ZIP-Datei auf verstümmelte Zeichen stoßen. Um dieses Problem zu lösen, müssen wir zunächst den Dateinamen in die UTF-8-Kodierung konvertieren, um verstümmelte Zeichen zu vermeiden. In diesem Artikel haben wir das Paket golang.org/x/text/transform verwendet, um Dateinamen vom GBK-Format in das UTF-8-Format zu konvertieren. Auf diese Weise können wir sicherstellen, dass der Dateiname beim Hinzufügen zur ZIP-Datei nicht verstümmelt wird.
Das obige ist der detaillierte Inhalt vonWie man mit chinesischem verstümmeltem Code in Golang Zip umgeht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



In dem Artikel wird erläutert, wie das PPROF -Tool zur Analyse der GO -Leistung verwendet wird, einschließlich der Aktivierung des Profils, des Sammelns von Daten und der Identifizierung gängiger Engpässe wie CPU- und Speicherprobleme.Character Count: 159

In dem Artikel werden Schreiben von Unit -Tests in GO erörtert, die Best Practices, Spottechniken und Tools für ein effizientes Testmanagement abdecken.

Dieser Artikel zeigt, dass Mocks und Stubs in GO für Unit -Tests erstellen. Es betont die Verwendung von Schnittstellen, liefert Beispiele für Mock -Implementierungen und diskutiert Best Practices wie die Fokussierung von Mocks und die Verwendung von Assertion -Bibliotheken. Die Articl

OpenSSL bietet als Open -Source -Bibliothek, die in der sicheren Kommunikation weit verbreitet sind, Verschlüsselungsalgorithmen, Tasten und Zertifikatverwaltungsfunktionen. In seiner historischen Version sind jedoch einige Sicherheitslücken bekannt, von denen einige äußerst schädlich sind. Dieser Artikel konzentriert sich auf gemeinsame Schwachstellen und Antwortmaßnahmen für OpenSSL in Debian -Systemen. DebianopensL Bekannte Schwachstellen: OpenSSL hat mehrere schwerwiegende Schwachstellen erlebt, wie z. Ein Angreifer kann diese Sicherheitsanfälligkeit für nicht autorisierte Lesen sensibler Informationen auf dem Server verwenden, einschließlich Verschlüsselungsschlüssel usw.

In diesem Artikel werden die benutzerdefinierten Typ -Einschränkungen von GO für Generika untersucht. Es wird beschrieben, wie Schnittstellen die minimalen Typanforderungen für generische Funktionen definieren und die Sicherheitstypsicherheit und die Wiederverwendbarkeit von Code verbessern. Der Artikel erörtert auch Einschränkungen und Best Practices

In dem Artikel wird das Reflect -Paket von Go, das zur Laufzeitmanipulation von Code verwendet wird, von Vorteil für die Serialisierung, generische Programmierung und vieles mehr. Es warnt vor Leistungskosten wie langsamere Ausführung und höherer Speichergebrauch, beraten die vernünftige Verwendung und am besten am besten

In dem Artikel werden mit Tabellensteuerungstests in GO eine Methode mit einer Tabelle mit Testfällen getestet, um Funktionen mit mehreren Eingaben und Ergebnissen zu testen. Es zeigt Vorteile wie eine verbesserte Lesbarkeit, verringerte Vervielfältigung, Skalierbarkeit, Konsistenz und a

In diesem Artikel wird die Verwendung von Tracing -Tools zur Analyse von GO -Anwendungsausführungsfluss untersucht. Es werden manuelle und automatische Instrumentierungstechniken, den Vergleich von Tools wie Jaeger, Zipkin und Opentelemetrie erörtert und die effektive Datenvisualisierung hervorheben
