신뢰할 수 있는 UTF-8을 ISO-8859-1(Latin-1) 문자열로 변환
UTF-8에서 ISO-8859-1(Latin-1)로 텍스트를 변환하는 것은 까다로울 수 있습니다. 겉으로는 단순해 보이지만 많은 개발자가 문제에 직면합니다. 일반적인 실수는 변환 시도 직후에 Encoding.GetString()
을 사용하는 것입니다. 강력한 솔루션은 다음과 같습니다.
이 접근 방식은 간단한 바이트 배열 변환 후 Encoding.GetString()
를 직접 사용하는 함정을 방지합니다. 대신 인코딩 차이를 적절하게 처리할 수 있습니다.
UTF-8 바이트 가져오기: utf8.GetBytes(Message)
를 사용하여 입력 문자열(Message
)의 UTF-8 바이트 표현을 가져옵니다.
ISO-8859-1 바이트로 변환: Encoding.Convert(utf8, iso, utfBytes)
을 사용하여 UTF-8 바이트를 ISO-8859-1 바이트로 변환합니다. 이 단계는 잠재적인 문자 매핑 문제를 처리하는 데 중요합니다.
ISO-8859-1 바이트 디코딩: 마지막으로 iso.GetString(isoBytes)
를 사용하여 결과 ISO-8859-1 바이트를 문자열(msg
)로 디코딩합니다. 이렇게 하면 최종 문자열이 대상 인코딩을 사용하여 올바르게 해석됩니다.
이 세 단계를 따르면 UTF-8 문자열을 ISO-8859-1로 변환하는 안정적인 방법을 제공하여 직접 문자열 디코딩과 관련된 일반적인 오류를 방지할 수 있습니다.
위 내용은 UTF-8 문자열을 ISO-8859-1(Latin1)로 안정적으로 변환하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!