Membaca Fail dengan BOM dalam Go
Soalan:
Bagaimana saya boleh membaca fail Unicode mengandungi atau tiada tanda pesanan bait (BOM) dalam Go? Adakah terdapat kaedah standard untuk mengendalikan perkara ini?
Jawapan:
Perpustakaan standard Go tidak menyediakan kaedah khusus untuk pengendalian BOM. Berikut ialah dua pendekatan untuk melaksanakan sendiri fungsi ini:
Pendekatan Pembaca Tertimbal:
Pakej bufio menawarkan penyelesaian yang mudah untuk mengendalikan BOM. Anda boleh membalut pembaca buffer di sekeliling strim data anda dan memeriksa rune pertama:
<code class="go">import ( "bufio" "os" ) func main() { fd, err := os.Open("filename") if err != nil { // Handle error } br := bufio.NewReader(fd) r, _, err := br.ReadRune() if err != nil { // Handle error } if r != '\uFEFF' { br.UnreadRune() // Not a BOM -- put the rune back } }</code>
Jika rune pertama bukan BOM, anda boleh meneruskan membaca daripada pembaca buffer seperti yang dijangkakan.
Pendekatan Antara Muka Pencari:
Untuk objek yang melaksanakan antara muka io.Seeker (seperti os.File), anda boleh menyemak tiga bait pertama secara terus dan mencari kembali ke permulaan jika terdapat tiada BOM:
<code class="go">import ( "os" ) func main() { fd, err := os.Open("filename") if err != nil { // Handle error } bom := [3]byte _, err = io.ReadFull(fd, bom[:]) if err != nil { // Handle error } if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf { _, err = fd.Seek(0, 0) // Not a BOM -- seek back to the beginning if err != nil { // Handle error } } }</code>
Perhatikan bahawa pendekatan ini menganggap pengekodan UTF-8. Untuk pengekodan lain, pengendalian yang lebih kompleks diperlukan.
Atas ialah kandungan terperinci Bagaimana untuk Membaca Fail Unicode dengan dan Tanpa BOM dalam Go?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!