> 백엔드 개발 > Golang > Go에서 BOM(바이트 순서 표시)이 있는 파일을 처리하는 방법은 무엇입니까?

Go에서 BOM(바이트 순서 표시)이 있는 파일을 처리하는 방법은 무엇입니까?

Linda Hamilton
풀어 주다: 2024-11-03 15:31:30
원래의
625명이 탐색했습니다.

How to Handle Files with a Byte-Order Mark (BOM) in Go?

Go에서 BOM(바이트 순서 표시)이 있는 파일 읽기

Go에서 바이트 순서가 있거나 없는 유니코드 파일 처리 마크(BOM)는 수동 처리가 필요합니다. 핵심 라이브러리 내에 확립된 방법은 없지만 일반적인 접근 방식은 다음과 같습니다.

버퍼 리더 사용:

Java.io.BufferedReader를 활용하여 다음을 수행할 수 있습니다. 처음 몇 바이트를 포함하여 파일에서 데이터를 읽습니다. 예는 다음과 같습니다.

import (
    "bufio"
    "os"
    "log"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        log.Fatal(err)
    }
    defer fd.Close()
    br := bufio.NewReader(fd)
    r, _, err := br.ReadRune()
    if err != nil {
        log.Fatal(err)
    }
    if r != '\uFEFF' {
        br.UnreadRune()
    }
}
로그인 후 복사

첫 번째 바이트 직접 읽기:

io.Seeker 인터페이스가 지원되면 처음 3바이트를 읽고 확인할 수 있습니다. BOM이 식별되지 않으면 파일 포인터가 시작 부분으로 재설정될 수 있습니다.

import (
    "os"
    "log"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        log.Fatal(err)
    }
    defer fd.Close()
    var bom [3]byte
    _, err = fd.Read(bom[:])
    if err != nil {
        log.Fatal(err)
    }
    if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf {
        _, err = fd.Seek(0, 0)
        if err != nil {
            log.Fatal(err)
        }
    }
}
로그인 후 복사

참고:

이러한 접근 방식에서는 UTF-8 인코딩을 가정합니다. 다양한 인코딩을 처리하면 복잡성이 더해집니다.

위 내용은 Go에서 BOM(바이트 순서 표시)이 있는 파일을 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿