Java의 GBK에서 UTF-8 왜곡 코드에 대한 솔루션-java지도 시간-php.cn

집

Java

java지도 시간

Java의 GBK에서 UTF-8 왜곡 코드에 대한 솔루션

angryTom

Feb 10, 2020 am 10:53 AM

gbk java utf-8 왜곡된 문자

Java의 GBK에서 UTF-8 왜곡 코드에 대한 솔루션

Java에서 GBK를 UTF-8로 변환하는 잘못된 코드에 대한 솔루션

GBK 인코딩을 사용하고 상대방이 UTF-8 인코딩을 사용하는 경우 데이터를 보낼 때 GBK 인코딩 데이터를 UTF-8 인코딩으로 변환해야 합니다. 상대방이 데이터를 왜곡하지 않도록 데이터를 저장합니다.

문제 발생: GBK를 UTF-8로 변환하면 홀수 개의 한자가 깨져 보이지만 짝수 개의 한자는 깨지지 않습니다.

원인 분석:

public static void analyze() throws UnsupportedEncodingException {
String gbk = "我来了";
String utf8 = new String(gbk.getBytes("UTF-8"));
for (byte b : gbk.getBytes("UTF-8")) {
System.out.print(b + " ");
}
System.out.println();
for (byte b : utf8.getBytes()) {
System.out.print(b + " ");
}
}
/*
-26 -120 -111 -26 -99 -91 -28 -70 -122
-26 -120 -111 -26 -99 -91 -28 -70 63 !
*/

로그인 후 복사

마지막 바이트가 다르다는 점에 유의하세요. 위 줄은 올바른 UTF-8 인코딩입니다. 그렇다면 다음 줄의 마지막 바이트가 -122가 아닌 63인 이유는 무엇입니까? 이것이 횡설수설의 원인입니다.

GBK 인코딩은 중국어에서 2바이트인 반면, UTF-8 인코딩은 중국어에서 3바이트입니다. getBytes("UTF-8") 메소드를 호출하면 계산을 통해 바이트가 추가되므로 GBK에서 2바이트가 됩니다. UTF-8에 해당하는 3바이트입니다. 따라서 위 예의 한자 세 개는 9바이트를 출력합니다.

(관련 동영상 튜토리얼 공유: java 동영상 튜토리얼)

문제 해결

바이트가 올바른지 확인하는 것이 마지막입니다. getBytes("UTF-8")를 호출하여 바이트 배열로 변환할 때 ISO-8859-1 인코딩된 문자열을 생성합니다. ISO-8859-1 인코딩은 1바이트가 1문자에 해당하므로 마지막 바이트가 실수되지 않음을 의미합니다. .

아아아아

위 내용은 Java의 GBK에서 UTF-8 왜곡 코드에 대한 솔루션의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7467

Cakephp 튜토리얼

1376

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

자바의 제곱근 Aug 30, 2024 pm 04:26 PM

자바의 제곱근 안내 여기서는 예제와 코드 구현을 통해 Java에서 Square Root가 어떻게 작동하는지 설명합니다.

자바의 완전수 Aug 30, 2024 pm 04:28 PM

Java의 완전수 가이드. 여기서는 정의, Java에서 완전 숫자를 확인하는 방법, 코드 구현 예제에 대해 논의합니다.

Java의 난수 생성기 Aug 30, 2024 pm 04:27 PM

Java의 난수 생성기 안내. 여기서는 예제를 통해 Java의 함수와 예제를 통해 두 가지 다른 생성기에 대해 설명합니다.

자바의 웨카 Aug 30, 2024 pm 04:28 PM

Java의 Weka 가이드. 여기에서는 소개, weka java 사용 방법, 플랫폼 유형 및 장점을 예제와 함께 설명합니다.

Java의 스미스 번호 Aug 30, 2024 pm 04:28 PM

Java의 Smith Number 가이드. 여기서는 정의, Java에서 스미스 번호를 확인하는 방법에 대해 논의합니다. 코드 구현의 예.

Java Spring 인터뷰 질문 Aug 30, 2024 pm 04:29 PM

이 기사에서는 가장 많이 묻는 Java Spring 면접 질문과 자세한 답변을 보관했습니다. 그래야 면접에 합격할 수 있습니다.

Java 8 Stream foreach에서 나누거나 돌아 오시겠습니까? Feb 07, 2025 pm 12:09 PM

Java 8은 스트림 API를 소개하여 데이터 컬렉션을 처리하는 강력하고 표현적인 방법을 제공합니다. 그러나 스트림을 사용할 때 일반적인 질문은 다음과 같은 것입니다. 기존 루프는 조기 중단 또는 반환을 허용하지만 스트림의 Foreach 메소드는이 방법을 직접 지원하지 않습니다. 이 기사는 이유를 설명하고 스트림 처리 시스템에서 조기 종료를 구현하기위한 대체 방법을 탐색합니다. 추가 읽기 : Java Stream API 개선 스트림 foreach를 이해하십시오 Foreach 메소드는 스트림의 각 요소에서 하나의 작업을 수행하는 터미널 작동입니다. 디자인 의도입니다

Java의 날짜까지의 타임스탬프 Aug 30, 2024 pm 04:28 PM

Java의 TimeStamp to Date 안내. 여기서는 소개와 예제와 함께 Java에서 타임스탬프를 날짜로 변환하는 방법에 대해서도 설명합니다.

See all articles

Java의 GBK에서 UTF-8 왜곡 코드에 대한 솔루션

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제