Python 문자 인코딩 변환 방법에 대한 자세한 설명

高洛峰
풀어 주다: 2017-03-17 16:53:41
원래의
1686명이 탐색했습니다.

python에는 str object과 unicode object string이 있는데, 둘 다 문자의 바이트 인코딩을 저장할 수 있지만 유형이 다릅니다. 매우 중요하며 이것이 인코딩과 디코딩이 있는 이유입니다. Python에서

encode 및 decode의 의미는

encode

unicode ------------로 표현할 수 있습니다. - ------------> str

유니코드 <------------ - str

decode

몇 가지 일반적인 방법:

str_string.decode('codec')은 str_string을 변환하는 것입니다. 은 unicode_string, codec은 소스 str_string의 인코딩 방법

unicode_string.encode('codec')은 unicode_string을 str_string으로 변환하는 것, codec은 대상 str_string의 인코딩 방법

str_string.decode( 'from_codec').encode('to_codec')는 서로 다른 인코딩의 str_string 간 변환을 실현할 수 있습니다

예:

>>> t='Great Wall'

>>> t

'xb3xa4xb3xc7'

>>> t.decode('gb2312').encode('utf-8')

'xe9x95xbfxe5x9fx8e'

str_string.encode('codec')는 먼저 시스템의 기본 코덱을 호출하여 str_string을 unicode_string으로 변환한 다음 encode 매개 변수 코덱을 사용하여 최종 str_string으로 변환하는 것과 같습니다. str_string.decode('sys_codec').encode('코덱').

unicode_string.decode('codec')는 기본적으로 의미가 없습니다. 유니코드는 Python, UTF16 또는 UTF32(이미 Python 컴파일 시 결정됨)에서 하나의 유니코드 인코딩만 사용하며 인코딩 변환이 필요하지 않습니다.

참고: 기본 코덱은

import sys

sys.setdefaultencoding('utf-8')과 같이 site-packages 아래의 sitecustomize.py 파일에 지정되어 있습니다.


위 내용은 Python 문자 인코딩 변환 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿