> 백엔드 개발 > Golang > Go에서 UTF-8로 인코딩되지 않은 텍스트 파일을 읽는 방법은 무엇입니까?

Go에서 UTF-8로 인코딩되지 않은 텍스트 파일을 읽는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-12-01 03:29:13
원래의
279명이 탐색했습니다.

How to Read Non-UTF-8 Encoded Text Files in Go?

Go에서 UTF-8이 아닌 텍스트 파일 읽기

Go에서 표준 라이브러리는 모든 텍스트 파일에 대해 UTF-8 인코딩을 가정합니다. 그러나 다른 문자 집합으로 인코딩된 파일의 경우에는 그렇지 않을 수 있습니다. 이 문서에서는 golang.org/x/text/encoding 패키지를 사용하여 Go에서 UTF-8이 아닌 텍스트 파일을 읽는 방법을 설명합니다.

golang.org/x/text/encoding 패키지는 일반 텍스트 파일에 대한 인터페이스를 제공합니다. UTF-8로 변환하거나 UTF-8에서 변환할 수 있는 문자 인코딩입니다. 예를 들어 golang.org/x/text/encoding/simplifiedchinese 하위 패키지는 GB18030, GBK 및 HZ-GB2312용 인코더를 제공합니다.

예: GBK 인코딩 파일 읽기

package main

import (
    "bufio"
    "fmt"
    "log"
    "os"

    "golang.org/x/text/encoding/simplifiedchinese"
    "golang.org/x/text/transform"
)

func main() {
    const filename = "example_GBK_file"

    // Read UTF-8 from a GBK encoded file
    f, err := os.Open(filename)
    if err != nil {
        log.Fatal(err)
    }
    r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder())

    // Read converted UTF-8 from `r` as needed
    sc := bufio.NewScanner(r)
    for sc.Scan() {
        fmt.Printf("Read line: %s\n", sc.Bytes())
    }
    if err := sc.Err(); err != nil {
        log.Fatal(err)
    }
    if err = f.Close(); err != nil {
        log.Fatal(err)
    }
}
로그인 후 복사

이 예에서는 변환을 사용합니다.NewReader os.File 객체를 사용하고 GBK에서 UTF-8로 즉시 디코딩을 수행합니다.

추가 참고 사항:

  • 이 접근 방식은 os.File에서 제공하는 패키지만 사용합니다. Go 작성자는 타사 패키지 또는 cgo에 대한 종속성을 제거합니다.
  • 인코딩 구현을 쉽게 교체하여 다음과 같은 다른 문자 집합을 지원할 수 있습니다. Big5, Windows1252 또는 EUCKR.
  • 자세한 내용은 golang.org/x/text/encoding 및 golang.org/x/text/encoding/simplifiedchinese 패키지를 참조하세요.

위 내용은 Go에서 UTF-8로 인코딩되지 않은 텍스트 파일을 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿