> 백엔드 개발 > Golang > Go에서 BOM이 있거나 없는 유니코드 파일을 읽는 방법은 무엇입니까?

Go에서 BOM이 있거나 없는 유니코드 파일을 읽는 방법은 무엇입니까?

DDD
풀어 주다: 2024-11-07 11:49:03
원래의
239명이 탐색했습니다.

How to Read Unicode Files with and Without BOMs in Go?

Go에서 BOM이 포함된 파일 읽기

질문:

유니코드 파일을 어떻게 읽을 수 있나요? Go에 BOM(바이트 순서 표시)이 포함되어 있거나 부족합니까? 이를 처리하는 표준 방법이 있습니까?

답변:

Go의 표준 라이브러리는 BOM 처리를 위한 전용 방법을 제공하지 않습니다. 다음은 이 기능을 직접 구현하는 두 가지 접근 방식입니다.

버퍼 리더 접근 방식:

bufio 패키지는 BOM 처리를 위한 편리한 솔루션을 제공합니다. 데이터 스트림 주위에 버퍼링된 판독기를 래핑하고 첫 번째 룬을 검사할 수 있습니다.

<code class="go">import (
    "bufio"
    "os"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        // Handle error
    }

    br := bufio.NewReader(fd)
    r, _, err := br.ReadRune()
    if err != nil {
        // Handle error
    }

    if r != '\uFEFF' {
        br.UnreadRune() // Not a BOM -- put the rune back
    }
}</code>
로그인 후 복사

첫 번째 룬이 BOM이 아닌 경우 예상대로 버퍼링된 판독기에서 계속 읽을 수 있습니다.

Seeker 인터페이스 접근 방식:

io.Seeker 인터페이스를 구현하는 객체(예: os.File)의 경우 처음 3바이트를 직접 확인하고 다음이 있는 경우 시작 부분으로 다시 탐색할 수 있습니다. BOM 없음:

<code class="go">import (
    "os"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        // Handle error
    }

    bom := [3]byte
    _, err = io.ReadFull(fd, bom[:])
    if err != nil {
        // Handle error
    }

    if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf {
        _, err = fd.Seek(0, 0) // Not a BOM -- seek back to the beginning
        if err != nil {
            // Handle error
        }
    }
}</code>
로그인 후 복사

이 접근 방식에서는 UTF-8 인코딩을 가정합니다. 다른 인코딩의 경우 더 복잡한 처리가 필요합니다.

위 내용은 Go에서 BOM이 있거나 없는 유니코드 파일을 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿