Python의 구조체는 주로 C 구조 데이터를 처리하는 데 사용됩니다. 읽을 때 먼저 Python의 문자열 유형으로 변환된 다음 Tuple과 같은 Python의 구조화된 유형으로 변환됩니다. 일반적으로 입력 채널은 파일 또는 네트워크 바이너리 스트림에서 제공됩니다.
1.struct.pack() 및 struct.unpack()
변환 과정에서는 주로 형식 문자열을 사용하여 변환 방법을 지정합니다. 체재.
주요 메서드에 대해 이야기해 보겠습니다.
1.1 struct.pack(fmt,v1,v2,...)
v1, v2 및 기타 매개변수를 입력합니다. 값은 다음과 같습니다. 하나의 레이어로 래핑되며 래핑 방법은 fmt에 의해 지정됩니다. 래핑된 매개변수는 fmt를 엄격하게 준수해야 합니다. 마지막으로 은 래핑된 문자열 으로 반환됩니다.
1.2 struct.unpack(fmt,string)
이름에서 알 수 있듯이 압축을 푼다. 예를 들어 pack은 packaged이고 unpacked는 unpack에 사용될 수 있습니다. 튜플(tuple)을 반환 데이터(문자열)를 언패킹하여 얻은 데이터가 1개만 있어도 튜플로 언패킹됩니다. 그중 len(string)은 calcsize 함수를 포함하는 calcsize(fmt)와 동일해야 합니다. struct.calcsize(fmt): fmt 형식에 설명된 구조의 크기를 계산하는 데 사용됩니다.
형식 문자열은 하나 이상의 형식 문자로 구성됩니다. 이러한 형식 문자에 대한 설명은 다음과 같은 Python 설명서를 참조하세요.
Format | c Type | Python | Note |
---|---|---|---|
x | pad byte | no value | |
c | char | string of length 1 | |
b | signedchar | integer | |
B | unsignedchar | integer | |
? | _Bool | bool | (1) |
h | short | integer | |
H | unsignedshort | integer | |
i | int | integer | |
I | unsignedint | integer or long | |
l | long | integer | |
L | unsignedlong | long | |
q | longlong | long | (2) |
Q | unsignedlonglong | long | (2) |
f | float | float | |
d | double | float | |
s | char[] | string | |
p | char[] | string | |
P | void* | long |
2. 코드 예시
import struct # native byteorder buffer = struct.pack("ihb", 1, 2, 3) print repr(buffer) print struct.unpack("ihb", buffer) # data from a sequence, network byteorder data = [1, 2, 3] buffer = struct.pack("!ihb", *data) print repr(buffer) print struct.unpack("!ihb", buffer) Output: '\x01\x00\x00\x00\x02\x00\x03' (1, 2, 3) '\x00\x00\x00\x01\x00\x02\x03' (1, 2, 3)
코드 보기
먼저 매개변수 변경 1,2,3 Packing 패킹하기 전에는 1, 2, 3이 분명히 Python 데이터 유형의 정수에 속합니다. 패킹 후에는 C 구조의 이진 문자열이 됩니다. Python 문자열 유형으로 변환하면 'x01x00x00x00x02x00x03'으로 표시됩니다. 이 기계는 리틀 엔디안('리틀 엔디안')이므로 빅 엔디안과 리틀 엔디안의 차이점은 여기를 참조하십시오. 따라서 높은 비트는 낮은 주소 세그먼트에 배치됩니다. i는 C 구조체에서 int 유형을 나타냅니다. 이 머신은 4비트를 차지합니다. 1은 01000000으로 표현됩니다. h는 C 구조체의 짧은 유형을 나타내며 2비트를 차지하므로 0200으로 표현됩니다. 마찬가지로 b는 C 구조체의 부호 있는 char 유형을 나타내며 1비트를 차지합니다. 03. 기타 구조의 변환도 유사합니다. 일부 특수한 경우에는 공식 문서의 매뉴얼을 참조하면 됩니다. 빅 엔디안과 리틀 엔디안을 결정하는 선택적 문자입니다.
추가하지 않으면 기본값은 @입니다. 네이티브 문자 순서(빅 엔디안 또는 리틀 엔디안)를 사용하더라도 C 구조의 크기와 메모리 정렬은 네이티브 머신(네이티브)과 일치합니다. 일부 기계의 정수는 2비트인 반면 일부 기계는 4비트를 가지고 있으며 일부 기계 메모리는 4비트로 정렬되어 있고 일부는 n비트로 정렬되어 있습니다(n은 알 수 없으며 몇 개인지는 모릅니다).
다음과 같이 설명되는 표준 옵션도 있습니다. 표준을 사용하면 모든 유형에 대해 메모리 정렬이 없습니다.
예를 들어, 방금 애플릿의 후반부에서 사용된 형식 문자열의 첫 번째 비트는! , 이는 빅엔디안 모드 표준 정렬이므로 출력은 'x00x00x00x01x00x02x03'이며, 여기서 상위 비트 자체가 메모리의 상위 주소 비트에 배치됩니다.
Python의 struct.pack() 함수와 struct.unpack() 함수에 대한 자세한 소개는 PHP 중국어 홈페이지를 참고해주세요!