지역 사회

배우다

도구 라이브러리

AI 도구

여가

한국어

집 > 백엔드 개발 > 파이썬 튜토리얼 > Python 중국어 잘못된 코드

Python 중국어 잘못된 코드

巴扎黑

풀어 주다： 2016-12-07 10:41:19

원래의

1258명이 탐색했습니다.

파이썬 스크립트를 접하기 시작했는데, 시작하자마자 한자가 깨져버리는 문제에 부딪혔습니다.

인터넷에 있는 정보를 종합하면 다음과 같습니다.

파이썬에서 문자열의 내부 표현은 유니코드 인코딩입니다. 일반적으로 유니코드를 중간 인코딩으로 사용하는 데 필요합니다. 즉, 먼저 다른 인코딩의 문자열을 유니코드로 디코딩한 다음 유니코드에서 다른 인코딩으로 인코딩(인코딩)합니다.

디코드 디코딩에서 이 기능은 다른 인코딩된 문자열을 str1.decode('gb2312')와 같은 유니코드 인코딩으로 변환하는 것입니다. 이는 gb2312로 인코딩된 문자열 str1을 유니코드 인코딩으로 변환하는 것을 의미합니다.

인코딩 인코딩에서 이 기능은 유니코드 인코딩을 str2.encode('gb2312')와 같은 다른 인코딩된 문자열로 변환하는 것입니다. 이는 유니코드 인코딩 문자열 str2를 gb2312 인코딩으로 변환하는 것을 의미합니다.

문자열이 이미 유니코드인 경우 디코딩 시 오류가 발생하므로 일반적으로 인코딩 방법이 유니코드인지 판단해야 합니다.

isinstance(s , unicode) #유니코드인지 확인하는 데 사용됩니다.

유니코드가 아닌 인코딩 str을 사용하여 인코딩하면 오류가 발생합니다.

시스템의 기본 인코딩을 어떻게 얻나요?

#!/usr/bin/python

#coding=utf-8

sys 가져오기

print sys.getdefaultencoding()

영어 Windows에서 이 프로그램의 출력 문제는 프로그램 자체가 아니라 문자열 인코딩에 있습니다.

UliPad에서 다음 코드를 실행하면:

s=u"중국어" #Specify Unicode 인코딩

print s

메시지가 표시됩니다: UnicodeEncodeError: 'ascii' 코덱은 0-1 위치(서수가 범위(128)에 속하지 않음)의 문자를 인코딩할 수 없습니다. 울리패드의 콘솔 정보 출력창이 영문 윈도우이기 때문입니다.

마지막 문장을 다음으로 변경하세요: print s.encode('gb2312')

"중국어"라는 단어가 올바르게 출력될 수 있습니다.

마지막 문장을 print s.encode('utf8')

으로 변경하면 xe4xb8xadxe6x96x87이 출력됩니다. utf8을 출력하는 콘솔 정보 출력 창의 결과입니다. -ASCII 인코딩에 따라 인코딩된 문자열입니다.

unicode(str,'gb2312')는 str.decode('gb2312')와 동일합니다. 둘 다 gb2312로 인코딩된 str을 유니코드 인코딩으로 변환합니다.

str.__class__를 사용할 수 있습니다. str의 인코딩 형식

원리에 대해 오랫동안 이야기한 후 코드는 다음과 같습니다.

#coding=utf-8

#!/usr/bin/ python

s="中文"

if isinstance(s, unicode):

print s.encode( 'gb2312')

그 외:

s.decode('utf-8').encode('gb2312')

인쇄

관련 라벨：

python Python 中文乱码

이전 기사：JAVA Python 스크립트 조정 다음 기사：Python 목록 중복 제거

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

PHP 배열에 요소를 추가하는 방법

2023-03-14 15:58:02
간단한 객관식 평가 시스템을 구현하는 JS를 보여주는 예

1970-01-01 08:00:00
동일한 IP의 여러 제출을 제한하는 PHP 솔루션

2023-03-15 07:38:01
정규식을 사용하여 HTML에서 양식 유효성 검사 구현

1970-01-01 08:00:00
JavaScript 엄격 모드의 포인팅 문제에 대한 자세한 설명

1970-01-01 08:00:00
Java로 트리 메뉴(다단계 메뉴 포함)를 작성하기 위한 예제 코드

1970-01-01 08:00:00
마우스 오버 시 부드러운 전환을 구현하는 CSS3의 예에 대한 자세한 설명

1970-01-01 08:00:00
Swiper 캐러셀 이미지 소스코드 공유 분석

1970-01-01 08:00:00
VsCode 플러그인 요약 및 구성

1970-01-01 08:00:00
HttpUtils 요청 도구 클래스 코드

1970-01-01 08:00:00

최신 이슈

python3.x - 일괄 시작 명령을 사용하여 지정된 Python 스크립트를 실행할 때 Python 스크립트의 경로나 이름에 중국어 문자가 포함되어 있으면 실행할 수 없습니다.

에서 1970-01-01 08:00:00

0

0

0

url-rewrite - nginx 디렉토리 이후의 슬래시 문제

에서 1970-01-01 08:00:00

0

0

0

개발 환경 서버인 Nginx는 정적 파일 캐시를 지울 수 없습니다.

에서 1970-01-01 08:00:00

0

0

0

Nginx에서 502 문제를 빠르게 찾는 방법

에서 1970-01-01 08:00:00

0

0

0

이러한 요구 사항을 달성하기 위해 nginx를 사용하는 방법은 무엇입니까?

에서 1970-01-01 08:00:00

0

0

0

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿