


Apakah yang perlu saya lakukan jika golang membaca fail bercelaru?
Sebagai bahasa pembangunan, golang boleh dikatakan agak mudah dari segi membaca dan menulis fail, tetapi masih terdapat beberapa masalah yang dihadapi dalam pembangunan sebenar, seperti aksara bercelaru selepas fail dibaca. Artikel ini akan memperkenalkan sebab dan penyelesaian untuk membaca fail bercelaru dalam golang.
1. Latar belakang masalah
Apabila kita menggunakan golang untuk membaca fail, kadang-kadang kandungan selepas membaca akan bercelaru, seperti yang ditunjukkan dalam rajah di bawah:
2. 🎜 >Format pengekodan fail merujuk kepada format pengekodan kandungan fail apabila ia disimpan, bukan sambungannya. Apabila golang membaca fail, ia membacanya dalam format pengekodan UTF-8 secara lalai Jika fail yang dibaca tidak dalam format pengekodan UTF-8, aksara bercelaru akan muncul.
Sebagai contoh, kita boleh mencipta fail teks txt melalui alat baris arahan cmd sistem Windows dan menyimpannya menggunakan format pengekodan "gbk", seperti ditunjukkan di bawah:
Kemudian, kita menggunakan program golang untuk membaca, seperti yang ditunjukkan dalam rajah di bawah:Dalam golang, apabila membaca fail, jika format pengekodan ialah UTF-16 (termasuk UTF-16LE dan UTF-16BE), anda perlu mengendalikan endian dengan betul . UTF-16LE bermaksud bahawa dalam ingatan, bait tertib rendah disimpan di hadapan dan bait tertib tinggi disimpan di belakang, manakala UTF-16BE adalah sebaliknya.
Kadangkala, kami mungkin perlu menukar fail dalam format lain (seperti CSV, XML, dll.) ke dalam format yang disokong oleh golang untuk dibaca, tetapi semasa penukaran Mungkin terdapat masalah penukaran format pengekodan yang mengakibatkan aksara bercelaru.
3. Penyelesaian
Untuk situasi di atas, kami boleh menggunakan penyelesaian berikut:
3.1 Sahkan format pengekodan fail dan bacanya
Jika kita sudah tahu format pengekodan fail, kita perlu menentukan format pengekodan yang sepadan semasa membaca fail.
golang menyediakan kaedah
pakej, yang boleh digunakan untuk membaca fail dengan sangat mudah. Apabila menggunakan kaedah ini, anda boleh menentukan format pengekodan fail melalui kaedah seperti
danKodnya adalah seperti berikut:
ioutil
di mana kaedah ReadFile
akan menghasilkan pengekodan baharu. format berdasarkan format pengekodan yang ditentukan bufio.NewReader
objek, hanya gunakan objek ini untuk membaca fail. ioutil.NopCloser
func ReadFileWithCharset(filename string, charset string) ([]byte, error) { f, err := os.Open(filename) if err != nil { return nil, err } defer f.Close() r, err := charset.NewReader(f) if err != nil { return nil, err } defer r.Close() return ioutil.ReadAll(r) }
charset.NewReader
Apabila menggunakan pustaka ReadCloser
, anda perlu ambil perhatian bahawa panjang maksimum dalam pustaka ialah 32767 bait saiz melebihi had ini , maka bacaan bersegmen diperlukan.
Contoh kod: unicode/utf16
3.3. Gunakan pustaka unicode/utf16
untuk penukaran format pengekodan Pustaka
package main import ( "fmt" "io/ioutil" "unicode/utf16" ) func readUTF16File(filename string) ([]byte, error) { data, err := ioutil.ReadFile(filename) if err != nil { return nil, err } u := utf16.Decode(data) return []byte(string(u)), nil } func main() { data, _ := readUTF16File("test.txt") fmt.Println(string(data)) }
Contoh kod: golang.org/x/text
4 Ringkasangolang.org/x/text
untuk penukaran pesanan bait untuk isu penukaran format pengekodan yang lain; Anda boleh menggunakan pustaka
untuk penukaran. Melalui kaedah di atas, masalah membaca aksara bercelaru dalam fail golang dapat diselesaikan dengan berkesan dan kecekapan pembangunan dipertingkatkan.package main import( "fmt" "io/ioutil" "golang.org/x/text/encoding/charmap" ) func ReadFileWithCharset(filename string, charset string) ([]byte, error) { data, err := ioutil.ReadFile(filename) if err != nil { return nil, err } charmap := charmap.Windows1252.NewDecoder() return charmap.Bytes(data) } func main() { data,_:=ReadFileWithCharset("test.txt","UTF-8") fmt.Println(string(data)) }
Atas ialah kandungan terperinci Apakah yang perlu saya lakukan jika golang membaca fail bercelaru?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Artikel ini menerangkan mekanisme import pakej Go: Dinamakan import (mis., Import & quot; fmt & quot;) dan import kosong (mis., Import _ & quot; fmt & quot;). Dinamakan import membuat kandungan pakej boleh diakses, sementara import kosong hanya melaksanakan t

Artikel ini menerangkan fungsi Newflash () Beego untuk pemindahan data antara halaman dalam aplikasi web. Ia memberi tumpuan kepada menggunakan NewFlash () untuk memaparkan mesej sementara (kejayaan, kesilapan, amaran) antara pengawal, memanfaatkan mekanisme sesi. Limita

Artikel ini memperincikan penukaran yang cekap hasil pertanyaan MySQL ke dalam kepingan struct go. Ia menekankan menggunakan kaedah imbasan pangkalan data/SQL untuk prestasi optimum, mengelakkan parsing manual. Amalan terbaik untuk pemetaan medan struct menggunakan tag db dan robus

Artikel ini menunjukkan penciptaan dan stub di GO untuk ujian unit. Ia menekankan penggunaan antara muka, menyediakan contoh pelaksanaan mengejek, dan membincangkan amalan terbaik seperti menjaga mocks fokus dan menggunakan perpustakaan penegasan. Articl

Artikel ini meneroka kekangan jenis adat Go untuk generik. Ia memperincikan bagaimana antara muka menentukan keperluan jenis minimum untuk fungsi generik, meningkatkan keselamatan jenis dan kebolehgunaan semula kod. Artikel ini juga membincangkan batasan dan amalan terbaik

Artikel ini memperincikan penulisan fail yang cekap di GO, membandingkan OS.WriteFile (sesuai untuk fail kecil) dengan os.openfile dan buffered menulis (optimum untuk fail besar). Ia menekankan pengendalian ralat yang teguh, menggunakan penangguhan, dan memeriksa kesilapan tertentu.

Artikel ini membincangkan ujian unit menulis di GO, meliputi amalan terbaik, teknik mengejek, dan alat untuk pengurusan ujian yang cekap.

Artikel ini meneroka menggunakan alat pengesanan untuk menganalisis aliran pelaksanaan aplikasi GO. Ia membincangkan teknik instrumentasi manual dan automatik, membandingkan alat seperti Jaeger, Zipkin, dan OpenTelemetry, dan menonjolkan visualisasi data yang berkesan
