Dengan populariti berterusan dan aplikasi Golang dalam bidang pembangunan web, fail mampat Zip telah menjadi modul berfungsi yang sangat diperlukan. Walau bagaimanapun, sesetengah pembangun menghadapi masalah biasa apabila menggunakan pakej Zip Golang untuk pemampatan fail - nama fail Cina kelihatan bercelaru.
Ini adalah masalah yang sangat menyusahkan, kerana ia bukan sahaja menjadikan nama fail yang asalnya cantik kelihatan tidak jelas, tetapi juga boleh menyebabkan beberapa siri ralat lain. Di bawah ini kita akan meneroka punca dan penyelesaian kepada masalah ini.
Format zip ialah format binari yang mengandungi nama fail, direktori fail, kaedah pemampatan dan data termampat. Antara maklumat ini, nama fail adalah bahagian yang sangat kritikal, kerana ia menentukan nama dan laluan penyimpanan fail selepas pengguna menyahmampatnya.
Walau bagaimanapun, sistem fail dan format pengekodan yang berbeza mungkin menghasilkan hasil penghuraian yang berbeza untuk nama fail yang sama. Contohnya, pada sistem Windows, pengekodan lalai yang digunakan untuk nama fail ialah GBK, manakala pada sistem UNIX/Linux, nama fail menggunakan UTF-8. Jika kami tidak mengendalikan kaedah pengekodan yang berbeza ini apabila menggunakan pakej Zip dalam Golang untuk pemampatan, nama fail mungkin dianggap sebagai aksara yang tidak betul.
Kami mempunyai pelbagai penyelesaian kepada masalah nama fail Cina yang bercelaru. Di bawah ini kami akan memperkenalkan beberapa kaedah yang lebih boleh dilaksanakan.
Oleh kerana format Zip menggunakan pengekodan CP437 untuk mewakili nama fail, kami boleh menukar nama fail daripada pengekodan GB18030 kepada pengekodan CP437, untuk memastikan bahawa Nama fail boleh dihuraikan dengan betul dalam mana-mana persekitaran. Dalam Go, anda boleh menggunakan pakej golang.org/x/text/encoding/simplifiedchinese
untuk menukar antara pengekodan GB18030 dan pengekodan CP437.
import ( "golang.org/x/text/encoding/simplifiedchinese" "golang.org/x/text/transform" ) func GbkToUtf8(data []byte) ([]byte, error) { return transform.NewReader(bytes.NewReader(data), simplifiedchinese.GB18030.NewDecoder()).ReadAll() } func Utf8ToGbk(data []byte) ([]byte, error) { return transform.NewReader(bytes.NewReader(data), simplifiedchinese.GB18030.NewEncoder()).ReadAll() }
Kami juga boleh menggunakan pilihan reflect
dalam pakej StructTag
untuk memaksa penggunaan pengekodan yang ditentukan. Khususnya, anda boleh menambah zip
Teg pada struktur dan menambah teg chinese-utf8
pada Teg. Kod sampel adalah seperti berikut:
type File struct { Name string `zip:"filename=测试文件,chinese-utf8"` } func main() { zhName := "测试文件" utf8Name, _ := GbkToUtf8([]byte(zhName)) f := &File{Name: string(utf8Name)} // 压缩文件... }
Dalam pakej Zip Golang, kami juga boleh memanggil fileheader
dan FileInfo
daripada name
sifat untuk menentukan pengekodan yang betul secara manual untuk setiap fail.
import "archive/zip" func zipFiles(filePaths []string, dest string) error { // 创建文件 newZipFile, err := os.Create(dest) if err != nil { return err } defer newZipFile.Close() // 创建 ZIP writer 对象 zipWriter := zip.NewWriter(newZipFile) defer zipWriter.Close() // 遍历 filePaths,为每个文件设置正确的编码方式 for _, filePath := range filePaths { zipFile, err := os.Open(filePath) if err != nil { return err } defer zipFile.Close() // 解析文件名,并转换编码 zipFileInfo, _ := zip.FileInfoHeader(zipFile.Stat()) zipFileInfo.Name, _ = GbkToUtf8([]byte(zipFileInfo.Name)) // 创建 Zip 文件写入器 zipWriterNewFile, err := zipWriter.CreateHeader(zipFileInfo) if err != nil { return err } // 读取文件并写入 Zip 文件中 _, err = io.Copy(zipWriterNewFile, zipFile) if err != nil { return err } } return nil }
Untuk masalah nama fail Cina yang bercelaru, pakej Zip Golang menyediakan pelbagai penyelesaian. Jika format pengekodan nama fail tidak seragam, nama fail mudah dikacau. Kita boleh mengelak masalah ini dengan mudah dengan hanya memilih penyelesaian yang betul mengikut keperluan kita.
Atas ialah kandungan terperinci zip golang kod cina bercelaru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!