字符编码 - python使用split(‘中文字符’)出错

Question

根据网页所给的字符编码将其字节数据decode('gb2312')用的是scrapy，从给出的url获取body {代码...} 请问怎么解决？

大家讲道理 · Answer

으아악

위 오류를 다시 보니 byte 0xa3
이라 터미널에서 여러번 시도해보니 콜론 gb2312 encode

를 발견했습니다. 으아악

그러므로 Python은 기본 utf-8을 사용하여 gb2312의 본문을 디코딩해야 합니다. 따라서 제가 생각할 수 있는 한 가지 방법은 첫 번째 줄에 있는 명령문인 기본 인코딩 값을 수정하는 것입니다. # -*- coding: gb2312 -*-
그럼 수술 성공인데 다른 방법은 없나요?

迷茫 · Answer

伊谢尔伦 · Answer

디코딩 후 본문은 유니코드로 인코딩되어야 하며 다음 방법을 사용하세요.

으아악

PHP中文网 · Answer

또 다른 인코딩 문제는 인간-컴퓨터 상호 작용을 위한 문자 인코딩 및 5분 안에 Python 문자 인코딩 패배를 참조할 수 있습니다.

으아악