


Obtenir le type de données de la colonne dans Pandas - Python
Pandas est une bibliothèque Python populaire et puissante couramment utilisée pour l'analyse et la manipulation de données. Il fournit un certain nombre de structures de données, notamment Series, DataFrame et Panel, pour travailler avec des données tabulaires et des séries chronologiques.
Pandas DataFrame est une structure de données tabulaire bidimensionnelle. Dans cet article, nous aborderons différentes manières de déterminer le type de données d'une colonne dans Pandas. Il existe de nombreuses situations dans lesquelles nous devons trouver le type de données d'une colonne dans un Pandas DataFrame. Chaque colonne d'un Pandas DataFrame peut contenir différents types de données.
Avant de continuer, créons un exemple de dataframe sur lequel nous devons obtenir le type de données de la colonne dans Pandas
import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) print(df)
Sortie
Ce script python imprime le DataFrame que nous avons créé.
Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000
Les méthodes que vous pouvez utiliser pour accomplir la tâche sont les suivantes
Méthode
Utilisez l'attribut dtypes
Utilisez select_dtypes()
Utilisez la méthode info()
Utilisez la fonction décrire()
Parlons maintenant de chaque méthode et de la manière de les utiliser pour obtenir le type de données d'une colonne dans Pandas.
Méthode 1 : Utilisation des attributs dtypes
Nous pouvons utiliser l'attribut dtypes pour obtenir le type de données de chaque colonne du DataFrame. Cette propriété renverra une série contenant le type de données de chaque colonne. La syntaxe suivante peut être utilisée :
Grammaire
df.dtypes
Type de retour Le type de données de chaque colonne du DataFrame.
Algorithme
Importez la bibliothèque Pandas.
Créez un DataFrame en utilisant la fonction pd.DataFrame() et transmettez les exemples sous forme de dictionnaire.
Utilisez la propriété dtypes pour obtenir le type de données de chaque colonne du DataFrame.
Imprimez les résultats pour vérifier le type de données de chaque colonne.
Exemple 1
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # get the data types of each column print("\nData types of each column:") print(df.dtypes)
Sortie
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data types of each column: Vehicle name object price int64 dtype: object
Exemple 2
Dans cet exemple, nous obtenons le type de données d'une seule colonne du DataFrame
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # get the data types of column named price print("\nData types of column named price:") print(df.dtypes['price'])
Sortie
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data types of column named price: int64
Méthode 2 : utilisez select_dtypes()
Nous pouvons utiliser la méthode select_dtypes() pour filtrer les colonnes de types de données dont nous avons besoin. La méthode select_dtypes() renvoie un sous-ensemble de colonnes basé sur les types de données fournis en entrée. Cette méthode nous permet de sélectionner des colonnes appartenant à un type de données spécifique, puis de déterminer le type de données.
Algorithme
Importez la bibliothèque Pandas.
Utilisez la fonction pd.DataFrame() pour créer un DataFrame et transmettre les données données sous forme de dictionnaire.
Imprimez le DataFrame pour vérifier les données créées.
Utilisez la méthode select_dtypes() pour sélectionner toutes les colonnes numériques de DataFrame. Utilisez le paramètre include pour transmettre la liste des types de données que nous souhaitons sélectionner en tant que paramètres.
Faites une boucle sur les colonnes pour parcourir chaque colonne numérique et imprimer son type de données.
Exemple
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # select the numeric columns numeric_cols = df.select_dtypes(include=['float64', 'int64']).columns # get the data type of each numeric column for col in numeric_cols: print("Data Type of column", col, "is", df[col].dtype)
Sortie
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data Type of column price is int64
Méthode 3 : Utilisez la méthode info()
Nous pouvons également utiliser la méthode info() pour effectuer nos tâches. La méthode info() nous donne un résumé concis du DataFrame, y compris le type de données de chaque colonne. La syntaxe suivante peut être utilisée :
Grammaire
DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)
Valeur de retourAucun
Algorithme
Importez la bibliothèque Pandas.
Créez un DataFrame à l'aide de la fonction pd.DataFrame() et transmettez les données ci-dessus sous forme de dictionnaire.
Imprimez le DataFrame pour vérifier les données créées.
Utilisez la méthode info() pour obtenir des informations sur le DataFrame.
Imprimez les informations obtenues à partir de la méthode info().
Exemple
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # use the info() method to get the data type of each column print(df.info())
Sortie
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 2 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Vehicle name 3 non-null object 1 price 3 non-null int64 dtypes: int64(1), object(1) memory usage: 176.0+ bytes None
Méthode 4 : Utiliser la fonction décrire()
La méthodedescribe() est utilisée pour générer des statistiques descriptives du DataFrame, y compris le type de données de chaque colonne.
Algorithme
Utilisez l'instruction import pour importer la bibliothèque Pandas.
Utilisez la fonction pd.DataFrame() pour créer un DataFrame et transmettre les données données sous forme de dictionnaire.
Imprimez le DataFrame pour vérifier les données créées.
Utilisez la méthode décrire() pour obtenir les statistiques descriptives du DataFrame.
Utilisez le paramètre include de la méthodescribe() pour 'all' pour inclure toutes les colonnes dans les statistiques descriptives.
Utilisez la propriété dtypes pour obtenir le type de données de chaque colonne du DataFrame.
Imprimez le type de données de chaque colonne.
Exemple
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # use the describe() method to get the descriptive statistics of the dataframe desc_stats = df.describe(include='all') # get the data type of each column dtypes = desc_stats.dtypes # print the data type of each column print("Data type of each column in the descriptive statistics:\n", dtypes)
Sortie
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data type of each column in the descriptive statistics: Vehicle name object price float64 dtype: object
Conclusion
En sachant comment obtenir le type de données de chaque colonne, nous pouvons effectuer efficacement diverses opérations de données et travaux d'analyse. Chaque méthode présente ses propres avantages et inconvénients selon la méthode ou la fonction utilisée. Vous pouvez choisir la méthode souhaitée en fonction de la complexité souhaitée de l’expression et de vos préférences personnelles de codage.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Lorsque vous utilisez la bibliothèque Pandas de Python, comment copier des colonnes entières entre deux frames de données avec différentes structures est un problème courant. Supposons que nous ayons deux dats ...

L'article traite des bibliothèques Python populaires comme Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask et Demandes, détaillant leurs utilisations dans le calcul scientifique, l'analyse des données, la visualisation, l'apprentissage automatique, le développement Web et H et H

Les expressions régulières sont des outils puissants pour la correspondance des motifs et la manipulation du texte dans la programmation, améliorant l'efficacité du traitement de texte sur diverses applications.

Comment Uvicorn écoute-t-il en permanence les demandes HTTP? Uvicorn est un serveur Web léger basé sur ASGI. L'une de ses fonctions principales est d'écouter les demandes HTTP et de procéder ...

Fastapi ...

L'article traite du rôle des environnements virtuels dans Python, en se concentrant sur la gestion des dépendances du projet et l'évitement des conflits. Il détaille leur création, leur activation et leurs avantages pour améliorer la gestion de projet et réduire les problèmes de dépendance.

Dans Python, comment créer dynamiquement un objet via une chaîne et appeler ses méthodes? Il s'agit d'une exigence de programmation courante, surtout si elle doit être configurée ou exécutée ...
