서문
아마도 Python 3의 가장 중요한 새로운 기능은 텍스트와 바이너리 데이터를 더욱 명확하게 구분하는 것입니다. 텍스트는 항상 유니코드이며 str 유형으로 표시되고, 이진 데이터는 bytes 유형으로 표시됩니다. Python 3에서는 암시적인 방식으로 str과 bytes를 혼합하지 않으므로 둘 사이의 구분이 특히 명확해집니다. 문자열과 바이트 패킷을 연결할 수 없으며, 바이트 패킷에서 문자열을 검색할 수도 없고(반대의 경우도 마찬가지), 바이트 패킷을 매개변수로 사용하는 함수에 문자열을 전달할 수도 없습니다(반대의 경우도 마찬가지).
python3.0에서 바이트 데이터를 생성하는 방법
bytes([1,2,3,4,5,6,7,8,9]) bytes("python", 'ascii') # 字符串,编码
먼저 원래 문자열을 설정하고,
Python 3.2.3 (default, Apr 11 2012, 07:15:24) [MSC v.1500 32 bit (Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> website = 'http://www.www.php.cn/' >>> type(website) <class 'str'> >>> website 'http://www.www.php.cn/' >>>
utf-8에 따라 인코딩하고 바이트로 변환
>>> website_bytes_utf8 = website.encode(encoding="utf-8") >>> type(website_bytes_utf8) <class 'bytes'> >>> website_bytes_utf8 b'http://www.www.php.cn/' >>>
gb2312에 따라 인코딩하고 바이트로 변환
>>> website_bytes_gb2312 = website.encode(encoding="gb2312") >>> type(website_bytes_gb2312) <class 'bytes'> >>> website_bytes_gb2312 b'http://www.php.cn/' >>>
문자열로 디코딩, 기본적으로 공백으로 유지
>>> website_string = website_bytes_utf8.decode() >>> type(website_string) <class 'str'> >>> website_string 'http://www.php.cn/' >>> >>>
는 gb2312 방식을 사용하여 문자열로 디코딩됩니다.
>>> website_string_gb2312 = website_bytes_gb2312.decode("gb2312") >>> type(website_string_gb2312) <class 'str'> >>> website_string_gb2312 'http://www.php.cn/' >>>
관련 기사 더 보기 python3에서 바이트와 문자열 사이의 변환에 대해서는 PHP 중국어 웹사이트를 주목하세요!