Wie gehe ich mit Byte-Order Marks (BOMs) in Go-Dateien um?

DDD
Freigeben: 2024-11-04 06:49:31
Original
937 Leute haben es durchsucht

How to Handle Byte-Order Marks (BOMs) in Go Files?

Dateien mit einer Stückliste in Go lesen

Beim Arbeiten mit Unicode-Dateien kann das Vorhandensein einer Byte-Order-Markierung (BOM) Auswirkungen auf die Dateianalyse haben. Obwohl nicht alle Unicode-Dateien eine Stückliste enthalten, ist es wichtig, diese beim Umgang mit plattformübergreifenden Daten zu berücksichtigen.

Standardansatz

Bedauerlicherweise fehlt in der Go-Standardbibliothek eine integrierte Methode dafür Umgang mit Stücklisten. Mehrere Ansätze ermöglichen es Ihnen jedoch, Dateien mit Stücklisten manuell zu prüfen und zu verarbeiten.

Ansätze für die Handhabung von Stücklisten

Verwendung eines gepufferten Lesegeräts

Durch die Verwendung von a Wenn Sie einen gepufferten Reader zwischen Ihrem Dateistream und dem aufrufenden Programm installieren, können Sie die ersten paar Bytes überprüfen und optional die Stückliste verwerfen, wenn sie gefunden wird. Das folgende Snippet demonstriert diesen Ansatz:

<code class="go">import (
    "bufio"
    "os"
    "log"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        log.Fatal(err)
    }
    defer fd.Close()
    br := bufio.NewReader(fd)
    r, _, err := br.ReadRune()
    if err != nil {
        log.Fatal(err)
    }
    if r != '\uFEFF' {
        br.UnreadRune() // Not a BOM -- put the rune back
    }
    // Now work with br as if you would with fd
}</code>
Nach dem Login kopieren

Verwendung von io.Seeker

Alternativ können Sie die io.Seeker-Schnittstelle verwenden, um innerhalb des Dateistreams zu suchen. Wenn die ersten drei Bytes keine Stückliste sind, gehen Sie zurück zum Anfang.

<code class="go">import (
    "os"
    "log"
    "io"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        log.Fatal(err)
    }
    defer fd.Close()
    bom := [3]byte
    _, err = io.ReadFull(fd, bom[:])
    if err != nil {
        log.Fatal(err)
    }
    if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf {
        _, err = fd.Seek(0, 0) // Not a BOM -- seek back to the beginning
        if err != nil {
            log.Fatal(err)
        }
    }
    // The next read operation on fd will read real data
}</code>
Nach dem Login kopieren

Überlegungen

Beide Methoden gehen davon aus, dass die Datei in UTF-8 codiert ist. Wenn die Codierungsinformationen unbekannt sind oder sich unterscheiden, sind möglicherweise komplexere Ansätze erforderlich. Denken Sie daran, Stücklisten bei der Arbeit mit Unicode-Dateien angemessen zu handhaben, um eine genaue Analyse und Datenintegrität sicherzustellen.

Das obige ist der detaillierte Inhalt vonWie gehe ich mit Byte-Order Marks (BOMs) in Go-Dateien um?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!