> 백엔드 개발 > Golang > Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?

Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-12-26 03:28:15
원래의
1012명이 탐색했습니다.

How to Handle Non-UTF-8 Encoded XML in Go?

Go에서 UTF-8이 아닌 XML 입력 처리

Go의 xml 패키지에서 Unmarshal 함수를 사용하여 XML 입력을 역마샬링하려고 할 때, 입력이 UTF-8로 인코딩되지 않으면 문제가 발생할 수 있습니다. 이 문제를 해결하려면 CharsetReader가 필요합니다.

CharsetReader를 찾을 수 있는 위치

다행히 Go의 net/html 패키지는 charset.NewReaderLabel 형식의 솔루션을 제공합니다. 이 리더는 UTF-8로 인코딩되지 않은 입력을 UTF-8로 변환하는 작업을 처리할 수 있습니다.

2015년 이후 업데이트된 솔루션

이전 버전의 Go에서는 사용자 정의 CharsetReader를 구현해야 했습니다. 그러나 최신 버전의 Go에서는 charset.NewReaderLabel을 사용하여 더 간단한 솔루션을 제공합니다. 업데이트된 코드 조각은 다음과 같습니다.

import (
    "encoding/xml"
    "bytes"
    "golang.org/x/net/html/charset"
)

// ...
reader := bytes.NewReader(theXml)
decoder := xml.NewDecoder(reader)
decoder.CharsetReader = charset.NewReaderLabel
err = decoder.Decode(&parsed)
로그인 후 복사

charset.NewReaderLabel을 CharsetReader로 사용하면 이제 Unmarshal 함수가 수동 변환이나 사용자 지정 구현 없이 UTF-8로 인코딩되지 않은 XML 입력을 성공적으로 처리할 수 있습니다.

위 내용은 Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿