Le type de fichier HDF5 (Hierarchical Data Format 5) est souvent utilisé pour stocker et traiter des ensembles de données volumineux et complexes. Il est parfait pour les utilisations scientifiques et industrielles car il est polyvalent, évolutif et efficace. Python est l'un des nombreux langages de programmation pouvant être utilisés pour générer, lire et modifier des fichiers HDF5. Dans ce didacticiel, nous allons vous montrer comment travailler avec des fichiers HDF5 en Python.
Nous devons installer le package "h5py". Nous pouvons l’installer à l’aide du pip du programme d’installation du package Python.
pip install h5py
Pour créer des fichiers HDF5 en Python, nous devons d'abord créer une instance de la classe "h5py.File". Nous pouvons ensuite utiliser cette instance pour créer et manipuler des ensembles de données et des groupes dans le fichier.
import h5py file = h5py.File("filename.hdf5", "w")
Importerh5pymodule
L'objet h5py doit être créé en utilisant l'en-tête et le mode du type de fichier ("w" pour l'écriture, "r" pour la lecture)
Utilisez les fonctions "Créer un ensemble de données" et "Créer un groupe" pour créer des ensembles de données et des groupes dans des fichiers.
Remplissez l'ensemble de données en utilisant la notation de tableau NumPy typique.
Utilisez la technique "Fermer" pour libérer de la mémoire objet et vider les données dans le fichier.
Créez des fichiers HDF5 à l'aide d'un seul ensemble de données
import h5py # Create a new HDF5 file file = h5py.File("example.hdf5", "w") # Create a dataset dataset = file.create_dataset("data", shape=(10,), dtype='i') # Write data to the dataset for i in range(10): dataset[i] = i # Close the file file.close()
Importez d’abord le package h5py installé. Créez un nouveau fichier HDF5 nommé "exemple.hdf5" avec des autorisations en écriture. Ensuite, créez une collection appelée "data", qui a la forme (10,) et le type de données est entier. Nous utilisons ensuite une boucle pour mettre des nombres compris entre 0 et 9 dans l'ensemble de données. Pour éviter les fuites de mémoire et garantir que toutes les données ont été validées dans le fichier, nous les supprimons à la fin. Ce code montre comment utiliser le module Python h5py pour créer un nouveau fichier HDF5, un ensemble de données et y ajouter des données.
Lire les données des fichiers HDF5 existants
import h5py import numpy as np # Open an existing HDF5 file file = h5py.File("example.hdf5", "r") # Read the dataset into a NumPy array dataset = file["data"] data = np.array(dataset) # Close the file file.close() # Print the data print(data)
[0 1 2 3 4 5 6 7 8 9]
Cela lira le fichier example.hdf5 créé dans l'exemple précédent, le décryptera et l'imprimera sur la console.
Un format de fichier puissant pour enregistrer et distribuer de grands ensembles de données est appelé HDF5. Il fournit un cadre en couches pour l'organisation des données et prend en charge le regroupement et la compression pour un stockage efficace. Le module h5py fournit une API facile à comprendre pour générer, lire et écrire des fichiers HDF5, permettant à HDF5 d'être facilement incorporé dans les applications Python. HDF5 est un outil utile pour quiconque travaille avec des fichiers volumineux en Python en raison de ses nombreuses utilisations.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!