UnicodeDecodeError: 'ascii' 코덱이 바이트를 디코딩할 수 없습니다
문제
ASCII 문자를 유니코드 문자열로 변환하면 "UnicodeDecodeError: 'ascii' 코덱을 디코딩할 수 없습니다."가 발생할 수 있습니다. 바이트" 오류입니다. 이는 기본 동작이 비ASCII 문자를 처리할 수 없는 ASCII 인코딩을 가정하는 것이기 때문에 발생합니다.
빠른 수정
- 문자열을 명시적으로 유니코드 문자열로 디코딩해야 합니다.
- 문자열이 UTF-8로 인코딩되었다고 가정하지 마세요.
- 다음과 같이 문자열을 유니코드 문자열로 변환합니다. 코드에서 가능한 한 빨리.
- 더 나은 유니코드 처리를 위해 로케일 수정을 고려하세요.
- 빠른 재로드 해킹을 피하세요.
Python 2.x의 유니코드 이해
유니코드 문자열에는 인코딩이 없으며 유니코드 포인트 코드가 포함되어 있지만 문자열에는 인코딩된 텍스트가 포함되어 있습니다. (예: UTF-8, UTF-16) Markdown 모듈은 품질 게이트로 unicode()를 사용하여 수신 문자열이 유니코드 문자열임을 보장합니다.
알고 있는 점과 예
- 인코딩 없는 명시적 변환: unicode('€')
- 유니코드 문자열로의 새로운 스타일 형식 문자열: u"통화는 다음과 같습니다. {}".format('€')
- 유니코드 문자열로의 이전 스타일 형식 문자열: u'통화는 다음과 같습니다: %s' % '€'
- 유니코드에 문자열 추가: u' 통화는 다음과 같습니다. ' '€'
유니코드 샌드위치
"유니코드 샌드위치"를 설정하세요. code: 입력 데이터를 유니코드로 디코딩하고, 유니코드 문자열로 작업하고, 출력 시 문자열로 인코딩합니다. 이렇게 하면 코드 중간에 인코딩 문제가 발생하지 않습니다.
입력 및 디코딩
- 'u' 접두사(예: u'Zürich')가 있는 소스 코드에서 유니코드 문자열을 정의하세요.
- ASCII가 아닌 문자가 포함된 소스 코드에 대해 올바른 인코딩 헤더를 설정하세요(예: # 인코딩: utf-8).
- 텍스트 파일 입력에 적절한 인코딩과 함께 io.open을 사용하세요.
- ASCII가 아닌 CSV 파일을 처리하려면 backports.csv를 활용하세요.
- 데이터베이스 구성 유니코드 데이터를 반환합니다.
- Content-type 헤더를 기반으로 HTTP 콘텐츠를 수동으로 디코딩합니다. charset.
출력
- print()는 유니코드를 콘솔의 인코딩으로 인코딩하려고 시도합니다.
- stdout 인코딩은 PYTHONIOENCODING 환경 변수를 사용하여 강제할 수 있습니다.
- io.open을 사용하여 유니코드를 바이트로 인코딩합니다. 파일 출력용 문자열.
Python 3 차이점
- Python 3의 str은 유니코드 문자열입니다.
- 기본 인코딩은 UTF-8입니다.
- open()은 기본적으로 텍스트 모드에서 작동하며 디코딩된 문자열(유니코드)을 반환합니다. 것).
위 내용은 Python 2.x에서 'UnicodeDecodeError: 'ascii' 코덱이 바이트를 디코딩할 수 없습니다.' 오류가 발생하는 이유는 무엇이며 어떻게 해결할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!