Introduction à l'utilisation de pack et unpack en Python-Tutoriel Python-php.cn

Maison

développement back-end

Tutoriel Python

Introduction à l'utilisation de pack et unpack en Python

巴扎黑

Aug 21, 2017 pm 02:47 PM

python

Parfois, vous devez utiliser python pour traiter des données binaires, par exemple lors de l'accès à des fichiers et à des opérations de socket. À ce stade, vous pouvez utiliser le module struct de python pour le compléter. Vous pouvez utiliser struct pour traiter les structures en langage C. 🎜>

Les trois fonctions les plus importantes du module struct sont pack(), unpack(), calcsize()

pack(fmt, v1, v2, ...) comme indiqué Un format donné (fmt), encapsuler les données dans une chaîne (en fait un flux d'octets similaire à une structure c)

unpack(fmt, string) Analyser les octets selon le format donné (fmt) Chaîne de flux , renvoie le tuple analysé

calcsize(fmt) Calcule le nombre d'octets de mémoire occupé par le format donné (fmt)

Les formats pris en charge dans la structure sont les suivants Tableau :

Format C Type Python Nombre d'octets

x pad octet sans valeur 1

c chaîne de caractères de longueur 1 1

b caractère signé entier 1

B entier de caractère non signé 1

? _Bool bool 1

h entier court 2

H entier court non signé 2

i int entier 4

I non signé int ou long 4

l long entier 4

L non signé long long 4

q long long long 8

Q non signé long long long 8

f float float 4

d double float 8

s char[] string 1

p char [] string 1

P void * long

Note 1. q et Q ne sont intéressants que lorsque la machine supporte les opérations 64 bits

Note 2. Chaque format peut être précédé de Un nombre, représentant le nombre

Note 3. Le format s représente une chaîne d'une certaine longueur, 4s représente une chaîne de longueur 4, mais p représente une chaîne pascal

Note 4. P est utilisé pour convertir un pointeur, sa longueur est liée à la longueur du mot machine

Note 5. Le dernier peut être utilisé pour représenter le type de pointeur, occupant 4 octets

afin d'être la même que la structure en c Lors de l'échange de données par corps, vous devez également considérer que certains compilateurs C ou C++ utilisent l'alignement des octets, qui est généralement un système 32 bits avec 4 octets comme unité. Par conséquent, la structure est convertie selon. l'ordre des octets de la machine locale. Vous pouvez utiliser l'ordre des octets dans le format. Un caractère pour modifier l'alignement. La définition est la suivante :

Ordre des octets des caractères Taille et alignement

@ natif. Compose 4 octets

= standard natif Selon le mot original Nombre de sections

< standard petit-boutiste basé sur le nombre d'octets d'origine

> standard endian basé sur le nombre d'octets d'origine

! réseau (= big-endian)

standard Selon le nombre d'octets d'origine

est utilisé en première position de fmt, tout comme '@5s6sif'

Exemple 1 :

La structure est la suivante :

struct Header
{
    unsigned short id;
    char[4] tag;
    unsigned int version;
    unsigned int count;
}

Copier après la connexion

Les données de structure ci-dessus sont reçues via socket.recv, qui est stocké dans la chaîne s. Il doit maintenant être analysé. Vous pouvez utiliser la fonction unpack() :

import struct
id, tag, version, count = struct.unpack("!H4s2I", s)

Copier après la connexion

Dans la chaîne de format ci-dessus, ! analyse, car nos données sont reçues du réseau et elles sont dans l'ordre des octets du réseau lorsqu'elles sont transmises sur le réseau. Le H suivant représente un identifiant court non signé, 4s représente une chaîne longue de 4 octets et 2I représente deux données de type int non signées. .

passe juste un décompression, et maintenant l'identifiant, la balise, la version, le nombre Nos informations y ont été enregistrées.

De même, il est également très pratique de regrouper les données locales au format struct :

ss = struct.pack("!H4s2I", id, tag, version, count);

Copier après la connexion

La fonction pack prend l'identifiant, la balise, la version, le nombre est converti en une structure. L'en-tête selon le format spécifié est maintenant une chaîne (en fait un flux d'octets similaire à une structure c). peut être envoyé via socket.send(ss).

Exemple 2 :

import struct
a=12.34
#将a变为二进制
bytes=struct.pack(&#39;i&#39;,a)

Copier après la connexion

À ce stade, bytes est une chaîne de caractères, et la chaîne est la même que le contenu de stockage binaire de a en octets.

Effectuez ensuite l'opération inverse et convertissez les octets de données binaires existants (en fait une chaîne) en type de données python :

#Notez que unpack renvoie un tuple !

<🎜 ! >

S'il est composé de plusieurs données, cela peut ressembler à ceci :

a,=struct.unpack(&#39;i&#39;,bytes)

Copier après la connexion

Les octets à ce moment sont des données sous forme binaire, et peuvent être écrits directement dans un fichier tel que binfile. write(bytes)

a=&#39;hello&#39;
b=&#39;world!&#39;
c=2
d=45.123
bytes=struct.pack(&#39;5s6sif&#39;,a,b,c,d)

Copier après la connexion

Ensuite, quand nous en avons besoin, nous pouvons le lire, bytes=binfile.read()

puis le décoder en une variable python via struct.unpack() :

'5s6sif' est appelé fmt, qui est une chaîne formatée, composée de chiffres et de caractères, 5s représente une chaîne de 5 caractères, 2i représente 2 entiers, etc. Voici les caractères disponibles. et types , ctype signifie qu'il peut correspondre aux types en python un à un.

a,b,c,d=struct.unpack(&#39;5s6sif&#39;,bytes)

Copier après la connexion

Remarque : Problèmes rencontrés lors du traitement des fichiers binaires

Lorsque nous traitons des fichiers binaires, nous devons utiliser la méthode suivante :

Ensuite binfile=open( Qu'est-ce que la différence entre les résultats du chemin de fichier, 'r') ?

binfile=open(filepath,&#39;rb&#39;)    
#读二进制文件
binfile=open(filepath,&#39;wb&#39;)   
#写二进制文件

Copier après la connexion

Il y a deux différences :

Premièrement, si vous rencontrez « 0x1A » lors de l'utilisation de « r », cela sera considéré comme la fin du fichier, qui est EOF. L'utilisation de « rb » ne pose pas ce problème. Autrement dit, si vous écrivez en binaire et lisez en texte, seule une partie du fichier sera lue si « 0X1A » est présent. Lorsque vous utilisez « rb », il lira jusqu'à la fin du fichier.

Deuxièmement, pour la chaîne x='abcndef', nous pouvons utiliser len(x) pour que sa longueur soit 7. Nous appelons n le caractère de nouvelle ligne, qui est en fait '0X0A'. Lorsque nous écrivons en « w », qui est le mode texte, « 0X0A » sera automatiquement transformé en deux caractères « 0X0D », « 0X0A » sur la plate-forme Windows, c'est-à-dire que la longueur du fichier devient en réalité 8. Lors de la lecture en mode texte 'r', il est automatiquement converti en caractère de nouvelle ligne d'origine. Si vous passez en mode binaire 'wb' pour écrire, un caractère restera inchangé et il sera lu tel quel lors de la lecture. Donc si vous écrivez en mode texte et lisez en mode binaire, vous devez considérer cet octet supplémentaire. « 0X0D » est également appelé caractère de retour chariot. Cela ne changera pas sous Linux. Parce que Linux utilise uniquement « 0X0A » pour représenter les sauts de ligne.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Repo: Comment relancer ses coéquipiers

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Comment obtenir des graines géantes

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Combien de temps faut-il pour battre Split Fiction?

3 Il y a quelques semaines By DDD

R.E.P.O. Enregistrer l'emplacement du fichier: où est-il et comment le protéger?

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7326

Tutoriel Java

1625

Tutoriel CakePHP

1350

Tutoriel Laravel

1262

Tutoriel PHP

1209

Afficher plus

Related knowledge

Comment résoudre le problème des autorisations rencontré lors de la visualisation de la version Python dans le terminal Linux? Apr 01, 2025 pm 05:09 PM

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Comment copier efficacement la colonne entière d'une dataframe dans une autre dataframe avec différentes structures dans Python? Apr 01, 2025 pm 11:15 PM

Lorsque vous utilisez la bibliothèque Pandas de Python, comment copier des colonnes entières entre deux frames de données avec différentes structures est un problème courant. Supposons que nous ayons deux dats ...

Les annotations des paramètres Python peuvent-elles utiliser des chaînes? Apr 01, 2025 pm 08:39 PM

Utilisation alternative des annotations des paramètres Python Dans la programmation Python, les annotations des paramètres sont une fonction très utile qui peut aider les développeurs à mieux comprendre et utiliser les fonctions ...

Comment les scripts Python effacent-ils la sortie en position de curseur à un emplacement spécifique? Apr 01, 2025 pm 11:30 PM

Comment les scripts Python effacent-ils la sortie en position de curseur à un emplacement spécifique? Lors de l'écriture de scripts Python, il est courant d'effacer la sortie précédente à la position du curseur ...

Python multiplateform de bureau de bureau de bureau: quelle bibliothèque GUI est la meilleure pour vous? Apr 01, 2025 pm 05:24 PM

Choix de la bibliothèque de développement d'applications de bureau multiplateforme Python De nombreux développeurs Python souhaitent développer des applications de bureau pouvant s'exécuter sur Windows et Linux Systems ...

Dessin graphique de sablier Python: comment éviter les erreurs variables non définies? Apr 01, 2025 pm 06:27 PM

Précision avec Python: Source de sablier Dessin graphique et vérification d'entrée Cet article résoudra le problème de définition variable rencontré par un novice Python dans le programme de dessin graphique de sablier. Code...

Pourquoi mon code ne peut-il pas faire renvoyer les données par l'API? Comment résoudre ce problème? Apr 01, 2025 pm 08:09 PM

Pourquoi mon code ne peut-il pas faire renvoyer les données par l'API? En programmation, nous rencontrons souvent le problème du retour des valeurs nulles lorsque l'API appelle, ce qui n'est pas seulement déroutant ...

Comment utiliser la technologie Python et OCR pour essayer de casser des codes de vérification complexes? Apr 01, 2025 pm 10:18 PM

Exploration des codes de vérification de fissuration utilisant Python dans les interactions quotidiennes du réseau, les codes de vérification sont un mécanisme de sécurité courant pour empêcher la manipulation malveillante des programmes automatisés ...

See all articles