Bagaimana untuk Membaca Fail Unicode dengan dan Tanpa BOM dalam Go?

DDD
Lepaskan: 2024-11-07 11:49:03
asal
119 orang telah melayarinya

How to Read Unicode Files with and Without BOMs in Go?

Membaca Fail dengan BOM dalam Go

Soalan:

Bagaimana saya boleh membaca fail Unicode mengandungi atau tiada tanda pesanan bait (BOM) dalam Go? Adakah terdapat kaedah standard untuk mengendalikan perkara ini?

Jawapan:

Perpustakaan standard Go tidak menyediakan kaedah khusus untuk pengendalian BOM. Berikut ialah dua pendekatan untuk melaksanakan sendiri fungsi ini:

Pendekatan Pembaca Tertimbal:

Pakej bufio menawarkan penyelesaian yang mudah untuk mengendalikan BOM. Anda boleh membalut pembaca buffer di sekeliling strim data anda dan memeriksa rune pertama:

<code class="go">import (
    "bufio"
    "os"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        // Handle error
    }

    br := bufio.NewReader(fd)
    r, _, err := br.ReadRune()
    if err != nil {
        // Handle error
    }

    if r != '\uFEFF' {
        br.UnreadRune() // Not a BOM -- put the rune back
    }
}</code>
Salin selepas log masuk

Jika rune pertama bukan BOM, anda boleh meneruskan membaca daripada pembaca buffer seperti yang dijangkakan.

Pendekatan Antara Muka Pencari:

Untuk objek yang melaksanakan antara muka io.Seeker (seperti os.File), anda boleh menyemak tiga bait pertama secara terus dan mencari kembali ke permulaan jika terdapat tiada BOM:

<code class="go">import (
    "os"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        // Handle error
    }

    bom := [3]byte
    _, err = io.ReadFull(fd, bom[:])
    if err != nil {
        // Handle error
    }

    if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf {
        _, err = fd.Seek(0, 0) // Not a BOM -- seek back to the beginning
        if err != nil {
            // Handle error
        }
    }
}</code>
Salin selepas log masuk

Perhatikan bahawa pendekatan ini menganggap pengekodan UTF-8. Untuk pengekodan lain, pengendalian yang lebih kompleks diperlukan.

Atas ialah kandungan terperinci Bagaimana untuk Membaca Fail Unicode dengan dan Tanpa BOM dalam Go?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!