


Bagaimana untuk menangani kod kacau Cina dalam zip golang
Dengan populariti bahasa Golang, semakin ramai orang mula menggunakannya untuk membangunkan aplikasi baharu. Salah satu aplikasi biasa adalah untuk membungkus fail dari sistem fail dan memampatkannya ke dalam fail ZIP. Terutama apabila berurusan dengan nama fail Cina, adalah mudah untuk menghadapi masalah aksara yang bercelaru. Artikel ini akan membincangkan cara menyelesaikan masalah aksara Cina yang kacau dalam zip Golang.
1. Perihalan Masalah
Apabila menggunakan pakej zip Golang, jika nama fail yang diproses mengandungi aksara Cina, aksara bercelaru akan muncul apabila output ke fail ZIP. Rajah di bawah menunjukkan struktur direktori yang mengandungi nama fail Cina:
example ├── file1.txt └── 文件2.txt
Kami menggunakan kod berikut untuk membungkusnya ke dalam fail ZIP:
package main import ( "archive/zip" "os" "path/filepath" ) func main() { zipFileName := "example.zip" files := []string{"example/file1.txt", "example/文件2.txt"} // Create a new ZIP file. zipFile, err := os.Create(zipFileName) if err != nil { panic(err) } defer zipFile.Close() // Create a new writer to write to the ZIP file. zipWriter := zip.NewWriter(zipFile) defer zipWriter.Close() // Iterate over the files and add them to the ZIP file. for _, file := range files { addFileToZip(file, zipWriter) } } func addFileToZip(file string, zipWriter *zip.Writer) error { // Open the file to be added to the ZIP file. fileToZip, err := os.Open(file) if err != nil { return err } defer fileToZip.Close() // Get the file information for the file being added. fileInfo, err := fileToZip.Stat() if err != nil { return err } // Create a new file header for the file being added. header, err := zip.FileInfoHeader(fileInfo) if err != nil { return err } // Set the name for the file being added (this is what appears in the ZIP archive). header.Name = filepath.Base(file) // Add the file header to the ZIP archive. writer, err := zipWriter.CreateHeader(header) if err != nil { return err } // Copy the contents of the file into the ZIP archive. _, err = io.Copy(writer, fileToZip) if err != nil { return err } return nil }
Melaksanakan program ini akan menghasilkan contoh . zip, buka fail yang dimampatkan, kita dapat melihat bahawa nama fail itu bercelaru. Seperti yang ditunjukkan dalam rajah di bawah:
Ini kerana apabila program melaksanakan zipWriter.CreateHeader (header), ia akan menggunakan pengekodan UTF-8 secara lalai untuk memproses nama fail , tetapi nama fail yang digunakan ialah pengekodan lalai sistem (GBK dalam kes saya). Oleh itu, ia menjadi kacau apabila menulis fail ZIP.
2. Penyelesaian
Untuk menyelesaikan masalah di atas, kami perlu memastikan bahawa nama fail ditukar kepada pengekodan UTF-8 sebelum menulis fail ZIP. Walau bagaimanapun, nama fail mungkin dijana menggunakan pengekodan lalai sistem, jadi kami mesti memastikan bahawa format pengekodan nama fail dikenal pasti dengan betul dan ditukar kepada pengekodan UTF-8.
Berikut ialah contoh mudah yang menunjukkan cara melaksanakan langkah di atas:
package main import ( "archive/zip" "bytes" "io" "os" "path/filepath" "golang.org/x/text/encoding/simplifiedchinese" "golang.org/x/text/transform" ) func main() { zipFileName := "example.zip" files := []string{"example/file1.txt", "example/文件2.txt"} // Create a new ZIP file. zipFile, err := os.Create(zipFileName) if err != nil { panic(err) } defer zipFile.Close() // Create a new writer to write to the ZIP file. zipWriter := zip.NewWriter(zipFile) defer zipWriter.Close() // Iterate over the files and add them to the ZIP file. for _, file := range files { addFileToZip(file, zipWriter) } } func addFileToZip(file string, zipWriter *zip.Writer) error { // Open the file to be added to the ZIP file. fileToZip, err := os.Open(file) if err != nil { return err } defer fileToZip.Close() // Get the file information for the file being added. fileInfo, err := fileToZip.Stat() if err != nil { return err } // Create a new file header for the file being added. header, err := zip.FileInfoHeader(fileInfo) if err != nil { return err } // Convert the file name to UTF-8. header.Name, err = toUTF8(fileInfo.Name()) if err != nil { return err } // Add the file header to the ZIP archive. writer, err := zipWriter.CreateHeader(header) if err != nil { return err } // Copy the contents of the file into the ZIP archive. _, err = io.Copy(writer, fileToZip) if err != nil { return err } return nil } func toUTF8(src string) (string, error) { var ( buf bytes.Buffer w = transform.NewWriter(&buf, simplifiedchinese.GBK.NewDecoder()) ) _, err := w.Write([]byte(src)) if err != nil { return "", err } err = w.Close() if err != nil { return "", err } return buf.String(), nil }
Dalam kod di atas, kami menggunakan pakej golang.org/x/text/transform untuk menukar nama fail daripada GBK Format ditukar kepada format UTF-8. Kami mula-mula mengimport pakej dan menukar nama fail daripada GBK kepada pengekodan UTF-8 melalui fungsi toUTF8(). Kemudian dalam fungsi addFileToZip() kami mengemas kini Header.Name dengan nama fail yang ditukar dan menambahnya pada fail ZIP.
Fail ZIP yang dijana dengan melaksanakan program ini akan mempunyai nama fail dipaparkan dalam bahasa Cina seperti biasa.
Ringkasan
Apabila menggunakan pakej zip Golang, jika terdapat nama fail Cina, anda akan menemui aksara bercelaru apabila mengeluarkan ke fail ZIP. Untuk menyelesaikan masalah ini, kita perlu menukar nama fail kepada pengekodan UTF-8 terlebih dahulu untuk mengelakkan aksara bercelaru. Dalam artikel ini, kami menggunakan pakej golang.org/x/text/transform untuk menukar nama fail daripada format GBK kepada format UTF-8. Dengan cara ini, kami boleh memastikan bahawa nama fail tidak akan bercelaru apabila menambahkannya pada fail ZIP.
Atas ialah kandungan terperinci Bagaimana untuk menangani kod kacau Cina dalam zip golang. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Artikel ini menerangkan cara menggunakan alat PPROF untuk menganalisis prestasi GO, termasuk membolehkan profil, mengumpul data, dan mengenal pasti kesesakan biasa seperti CPU dan isu memori.

Artikel ini membincangkan ujian unit menulis di GO, meliputi amalan terbaik, teknik mengejek, dan alat untuk pengurusan ujian yang cekap.

Artikel ini menunjukkan penciptaan dan stub di GO untuk ujian unit. Ia menekankan penggunaan antara muka, menyediakan contoh pelaksanaan mengejek, dan membincangkan amalan terbaik seperti menjaga mocks fokus dan menggunakan perpustakaan penegasan. Articl

OpenSSL, sebagai perpustakaan sumber terbuka yang digunakan secara meluas dalam komunikasi yang selamat, menyediakan algoritma penyulitan, kunci dan fungsi pengurusan sijil. Walau bagaimanapun, terdapat beberapa kelemahan keselamatan yang diketahui dalam versi sejarahnya, yang sebahagiannya sangat berbahaya. Artikel ini akan memberi tumpuan kepada kelemahan umum dan langkah -langkah tindak balas untuk OpenSSL dalam sistem Debian. Debianopenssl yang dikenal pasti: OpenSSL telah mengalami beberapa kelemahan yang serius, seperti: Kerentanan Pendarahan Jantung (CVE-2014-0160): Kelemahan ini mempengaruhi OpenSSL 1.0.1 hingga 1.0.1f dan 1.0.2 hingga 1.0.2 versi beta. Penyerang boleh menggunakan kelemahan ini untuk maklumat sensitif baca yang tidak dibenarkan di pelayan, termasuk kunci penyulitan, dll.

Artikel ini meneroka kekangan jenis adat Go untuk generik. Ia memperincikan bagaimana antara muka menentukan keperluan jenis minimum untuk fungsi generik, meningkatkan keselamatan jenis dan kebolehgunaan semula kod. Artikel ini juga membincangkan batasan dan amalan terbaik

Artikel ini membincangkan pakej GO's Reflect, yang digunakan untuk manipulasi kod runtime, bermanfaat untuk siri, pengaturcaraan generik, dan banyak lagi. Ia memberi amaran tentang kos prestasi seperti pelaksanaan yang lebih perlahan dan penggunaan memori yang lebih tinggi, menasihati penggunaan yang bijak dan terbaik

Artikel ini membincangkan menggunakan ujian yang didorong oleh jadual di GO, satu kaedah yang menggunakan jadual kes ujian untuk menguji fungsi dengan pelbagai input dan hasil. Ia menyoroti faedah seperti kebolehbacaan yang lebih baik, penurunan duplikasi, skalabiliti, konsistensi, dan a

Artikel ini meneroka menggunakan alat pengesanan untuk menganalisis aliran pelaksanaan aplikasi GO. Ia membincangkan teknik instrumentasi manual dan automatik, membandingkan alat seperti Jaeger, Zipkin, dan OpenTelemetry, dan menonjolkan visualisasi data yang berkesan
