Python3에는 문자 시퀀스를 나타내는 두 가지 유형, 즉 bytes와 str이 있습니다. 전자의 인스턴스에는 원시 8비트 바이트 값이 포함되어 있으며 각 값에는 8개의 이진 비트가 포함되어 있습니다. 후자의 인스턴스에는 유니코드 문자가 포함되어 있습니다. 유니코드 문자를 바이너리 데이터로 변환하는 가장 일반적인 인코딩 방법은 UTF-8이며, 바이너리 데이터를 유니코드 문자로 변환하려면 인코딩 방법을 사용해야 합니다.
실제 개발에서는 종종 이 두 가지 문자 유형 사이를 변환해야 하므로 변환된 입력 데이터가 기대에 부응할 수 있도록 이 두 가지 상황 사이를 변환하는 두 가지 보조 함수를 작성해야 합니다.
1. str 또는 bytes를 허용하고 항상 str을 반환하는 메서드:
def to_str(str_or_bytes):
if isinstance(str_or_bytes,bytes):
값 = str_or_bytes.decode('utf-8')
else:
값 = str_or_bytes
반환 값
2. str 또는 바이트를 허용하고 항상 바이트를 반환하는 메서드:
def to_bytes(str_or_bytes):
if isinstance(str_or_bytes,str):
value = str_or_bytes.encode ('utf-8')
else:
값 = str_or_bytes
반환값
위 내용은 Python 작은 함수 문자 유형 변환 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!