首頁 後端開發 Python教學 詳細介紹Python使用struct處理二進位(pack和unpack用法)

詳細介紹Python使用struct處理二進位(pack和unpack用法)

Mar 19, 2017 pm 02:49 PM
struct 二進位

有的時候需要用python處理二進位數據,比如,存取文件,socket操作時.這時候,可以使用python的struct模組來完成.可以用struct來處理c語言中的結構體.

struct模組中最重要的三個函數是pack(), unpack(), calcsize()

pack(fmt, v1, v2, ...)     依照給定的格式(fmt),將資料封裝成字串(其實是類似c結構體的位元組流)

unpack(fmt, string)       依照給定的格式(fmt)解析位元組流string,回傳解析出來的tuple

calcsize(fmt)          

#calcsize(fmt)     定的格式(fmt)佔用多少位元組的記憶體

struct中支援的格式如下表:

For

mat  C Type  Python  位元組數

x   pad byte    no value    1

c   char    string of length 1  1

#c   char    string of length 1  1

b   signed char#1ed

##?   _Bool   bool    1

h   short   integer 2

H   unsigned short  integer 2

i   int int 4# # int or long 4

l   long    integer 4

L   unsigned long   long    4

q   long long  

f  

float

  float   4

d   double  float   8

s   char[]  string  1##p  char#p P   void *  long

註1.q和Q只在機器支援64位元操作時有意思

註2.每個格式前可以有一個數字,表示個數

註3.s格式表示一定長度的字串,4s表示長度為4的字串,但是p表示的是pascal字串

註4.P用來轉換一個指標,其長度和機器字長相關

註5.最後一個可以用來表示指標類型的,佔4個位元組

為了同c中的結構體交換數據,還要考慮有的c或c++編譯器使用了位元組對齊,通常是以4個位元組為單位的32位元系統,故而struct根據本地機器位元組順序轉換.可以用格式中的第一個字元來改變對齊方式定義如下:

Character   Byte order  Size and alignment

@   native  native            湊夠4個位元組# #<;按原始位元組數

使用方法是放在fmt的第一個位置,就像'@5s6sif'

範例1:

結構體如下:

struct Header
{
    unsigned short id;
    char[4] tag;
    unsigned int version;
    unsigned int count;
}
登入後複製

透過socket.recv接收了一個上面的結構體數據,存在字串s中,現在需要把它解析出來,可以使用unpack()函數:

import struct
id, tag, version, count = struct.unpack("!H4s2I", s)
登入後複製

上面的格式字串中,!表示我們要使用網路位元組順序解析,因為我們的資料是從網路接收到的,在網路上傳送的時候它是網路位元組順序的.後面的H表示一個unsigned short的id,4s表示4位元組長的字串,2I表示有兩個unsigned int型別的資料.

就透過一個unpack,現在id, tag, version, count裡已經保存好我們的資訊了.

同樣,也可以很方便的把本地資料再pack成struct格式:

ss = struct.pack("!H4s2I", id, tag, version, count);
登入後複製

pack函數就把id, tag, version, count按照指定的格式轉換成了結構體Header,ss現在是一個字串(其實是類似c結構體的位元組流),可以透過socket.send(ss)把這個字串送出去。

範例2:

import struct
a=12.34
#将a变为二进制
bytes=struct.pack('i',a)
登入後複製

此時bytes就是一個string字串,字串以位元組同a的二進位儲存內容相同。

再進行反操作,現有二進位資料bytes,(其實就是字串),將它反過來轉換成python的

資料型別

#注意, unpack回傳的是tuple !!

a,=struct.unpack('i',bytes)
登入後複製

如果是由多個資料構成的,可以這樣:

a='hello'
b='world!'
c=2
d=45.123
bytes=struct.pack('5s6sif',a,b,c,d)
登入後複製

此時的bytes就是二進位形式的資料了,可以直接寫入檔案例如binfile.write(bytes)

然後,當我們需要時可以再讀出來,bytes=binfile.read()

再通过struct.unpack()解码成python变量:

a,b,c,d=struct.unpack('5s6sif',bytes)
登入後複製

’5s6sif’这个叫做fmt,就是格式化字符串,由数字加字符构成,5s表示占5个字符的字符串,2i,表示2个整数等等,下面是可用的字符及类型,ctype表示可以与python中的类型一一对应。

注意:二进制文件处理时会碰到的问题

我们使用处理二进制文件时,需要用如下方法:

binfile=open(filepath,'rb')    
#读二进制文件
binfile=open(filepath,'wb')   
#写二进制文件
登入後複製

那么和binfile=open(filepath,’r')的结果到底有何不同呢?

不同之处有两个地方:

第一,使用’r'的时候如果碰到’0x1A’,就会视为文件结束,这就是EOF。使用’rb’则不存在这个问题。即,如果你用二进制写入再用文本读出的话,如果其中存在’0X1A’,就只会读出文件的一部分。使用’rb’的时候会一直读到文件末尾。

第二,对于字符串x=’abc\ndef’,我们可用len(x)得到它的长度为7,\n我们称之为换行符,实际上是’0X0A’。当我们用’w'即文本方式写的时候,在windows平台上会自动将’0X0A’变成两个字符’0X0D’,’0X0A’,即文件长度实际上变成8.。当用’r'文本方式读取时,又自动的转换成原来的换行符。如果换成’wb’二进制方式来写的话,则会保持一个字符不变,读取时也是原样读取。所以如果用文本方式写入,用二进制方式读取的话,就要考虑这多出的一个字节了。’0X0D’又称回车符。linux下不会变。因为linux只使用’0X0A’来表示换行。

以上是詳細介紹Python使用struct處理二進位(pack和unpack用法)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

使用golang中的json.MarshalIndent函數將結構體轉換為格式化的JSON字串 使用golang中的json.MarshalIndent函數將結構體轉換為格式化的JSON字串 Nov 18, 2023 pm 01:59 PM

使用golang中的json.MarshalIndent函數將結構體轉換為格式化的JSON字串在使用Golang編寫程式時,我們經常需要將結構體轉換為JSON字串,在這個過程中,json.MarshalIndent函數可以幫助我們實現格式化的輸出。下面我們將詳細介紹如何使用這個函數,並提供具體的程式碼範例。首先,讓我們建立一個包含一些資料的結構體。以下是示

EDVAC有哪兩個重大的改進 EDVAC有哪兩個重大的改進 Mar 02, 2023 pm 02:58 PM

EDVAC的兩個重大的改進:一是採用二進制,二是完成了存貯程序,可以自動地從一個程序指令進到下一個程序指令,其作業可以透過指令自動完成。 「指令」包括資料和程序,把它們用碼的形式輸入到機器的記憶裝置中,即用記憶資料的同一記憶裝置存貯執行運算的命令,這就是所謂存貯程序的新概念。

二進位演算法怎麼算 二進位演算法怎麼算 Jan 19, 2024 pm 04:38 PM

二進位演算法是一種基於二進制數的運算方法,其基本運算包括加法、減法、乘法和除法。除了基本運算外,二進位演算法還包括邏輯運算、位移運算等操作。邏輯運算包括與、或、非等操作,位移運算包括左移和右移操作。這些操作都有對應的規則和操作數的要求。

如何使用C語言將二進位轉換為十六進位? 如何使用C語言將二進位轉換為十六進位? Sep 01, 2023 pm 06:57 PM

二進制數以1和0表示。 16位元的十六進位數係統為{0,1,2,3…..9,A(10),B(11),……F(15)}為了從二進位表示轉換為十六進位表示,位元串id被分組為4位元區塊,從最低有效側開始稱為半位元組。每個區塊都替換為相應的十六進制數字。讓我們看一個範例,以清楚地了解十六進制和二進制數字表示。 001111100101101100011101 3  E  5  B&nb

Golang如何讀取二進位檔案? Golang如何讀取二進位檔案? Mar 21, 2024 am 08:27 AM

Golang如何讀取二進位檔案?二進位檔案是以二進位形式儲存的文件,其中包含了電腦能夠識別和處理的資料。在Golang中,我們可以使用一些方法來讀取二進位文件,並將其解析成我們想要的資料格式。以下將介紹如何在Golang中讀取二進位文件,並給出具體的程式碼範例。首先,我們需要使用os包中的Open函數開啟二進位文件,這將會傳回一個文件物件。然後,我們可以使

電腦內部採用二進位的主要原因是什麼? 電腦內部採用二進位的主要原因是什麼? Apr 04, 2019 pm 02:25 PM

電腦採用二進位的主要原因:1、電腦是由邏輯電路組成,邏輯電路通常只有兩個狀態,開關的接通與斷開,這兩種狀態剛好可以用「1」與「0」表示;2、二進位只使用0和1兩個數字,傳輸和處理時不易出錯,因而可以保障電腦具有很高的可靠性。

輕鬆學會Go語言中16進制轉二進制 輕鬆學會Go語言中16進制轉二進制 Mar 15, 2024 pm 04:45 PM

題目:輕鬆學會Go語言中16進制轉二進制,需要具體程式碼範例在電腦程式設計中,經常會涉及到對不同進制數之間的轉換操作。其中,16進位和二進位之間的轉換是比較常見的。在Go語言中,我們可以透過一些簡單的程式碼範例來實現16進位到二進位的轉換,讓我們一起來學習一下。首先,我們來了解16進位和二進位的表示方法。 16進位是一種表示數字的方法,使用0-9和A-F來表示1

負數的二進位怎麼表示 負數的二進位怎麼表示 Nov 23, 2023 pm 04:11 PM

負數在計算機中以補碼表示,即用正數的二進位補數來表示負數。

See all articles