Pandas est une bibliothèque Python populaire et puissante couramment utilisée pour l'analyse et la manipulation de données. Il fournit un certain nombre de structures de données, notamment Series, DataFrame et Panel, pour travailler avec des données tabulaires et des séries chronologiques.
Pandas DataFrame est une structure de données tabulaire bidimensionnelle. Dans cet article, nous aborderons différentes manières de déterminer le type de données d'une colonne dans Pandas. Il existe de nombreuses situations dans lesquelles nous devons trouver le type de données d'une colonne dans un Pandas DataFrame. Chaque colonne d'un Pandas DataFrame peut contenir différents types de données.
Avant de continuer, créons un exemple de dataframe sur lequel nous devons obtenir le type de données de la colonne dans Pandas
import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) print(df)
Ce script python imprime le DataFrame que nous avons créé.
Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000
Les méthodes que vous pouvez utiliser pour accomplir la tâche sont les suivantes
Utilisez l'attribut dtypes
Utilisez select_dtypes()
Utilisez la méthode info()
Utilisez la fonction décrire()
Parlons maintenant de chaque méthode et de la manière de les utiliser pour obtenir le type de données d'une colonne dans Pandas.
Nous pouvons utiliser l'attribut dtypes pour obtenir le type de données de chaque colonne du DataFrame. Cette propriété renverra une série contenant le type de données de chaque colonne. La syntaxe suivante peut être utilisée :
Grammaire
df.dtypes
Type de retour Le type de données de chaque colonne du DataFrame.
Importez la bibliothèque Pandas.
Créez un DataFrame en utilisant la fonction pd.DataFrame() et transmettez les exemples sous forme de dictionnaire.
Utilisez la propriété dtypes pour obtenir le type de données de chaque colonne du DataFrame.
Imprimez les résultats pour vérifier le type de données de chaque colonne.
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # get the data types of each column print("\nData types of each column:") print(df.dtypes)
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data types of each column: Vehicle name object price int64 dtype: object
Dans cet exemple, nous obtenons le type de données d'une seule colonne du DataFrame
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # get the data types of column named price print("\nData types of column named price:") print(df.dtypes['price'])
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data types of column named price: int64
Nous pouvons utiliser la méthode select_dtypes() pour filtrer les colonnes de types de données dont nous avons besoin. La méthode select_dtypes() renvoie un sous-ensemble de colonnes basé sur les types de données fournis en entrée. Cette méthode nous permet de sélectionner des colonnes appartenant à un type de données spécifique, puis de déterminer le type de données.
Importez la bibliothèque Pandas.
Utilisez la fonction pd.DataFrame() pour créer un DataFrame et transmettre les données données sous forme de dictionnaire.
Imprimez le DataFrame pour vérifier les données créées.
Utilisez la méthode select_dtypes() pour sélectionner toutes les colonnes numériques de DataFrame. Utilisez le paramètre include pour transmettre la liste des types de données que nous souhaitons sélectionner en tant que paramètres.
Faites une boucle sur les colonnes pour parcourir chaque colonne numérique et imprimer son type de données.
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # select the numeric columns numeric_cols = df.select_dtypes(include=['float64', 'int64']).columns # get the data type of each numeric column for col in numeric_cols: print("Data Type of column", col, "is", df[col].dtype)
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data Type of column price is int64
Nous pouvons également utiliser la méthode info() pour effectuer nos tâches. La méthode info() nous donne un résumé concis du DataFrame, y compris le type de données de chaque colonne. La syntaxe suivante peut être utilisée :
Grammaire
DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)
Valeur de retourAucun
Importez la bibliothèque Pandas.
Créez un DataFrame à l'aide de la fonction pd.DataFrame() et transmettez les données ci-dessus sous forme de dictionnaire.
Imprimez le DataFrame pour vérifier les données créées.
Utilisez la méthode info() pour obtenir des informations sur le DataFrame.
Imprimez les informations obtenues à partir de la méthode info().
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # use the info() method to get the data type of each column print(df.info())
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 2 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Vehicle name 3 non-null object 1 price 3 non-null int64 dtypes: int64(1), object(1) memory usage: 176.0+ bytes None
describe() est utilisée pour générer des statistiques descriptives du DataFrame, y compris le type de données de chaque colonne.
Utilisez l'instruction import pour importer la bibliothèque Pandas.
Utilisez la fonction pd.DataFrame() pour créer un DataFrame et transmettre les données données sous forme de dictionnaire.
Imprimez le DataFrame pour vérifier les données créées.
Utilisez la méthode décrire() pour obtenir les statistiques descriptives du DataFrame.
Utilisez le paramètre include de la méthodescribe() pour 'all' pour inclure toutes les colonnes dans les statistiques descriptives.
Utilisez la propriété dtypes pour obtenir le type de données de chaque colonne du DataFrame.
Imprimez le type de données de chaque colonne.
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # use the describe() method to get the descriptive statistics of the dataframe desc_stats = df.describe(include='all') # get the data type of each column dtypes = desc_stats.dtypes # print the data type of each column print("Data type of each column in the descriptive statistics:\n", dtypes)
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data type of each column in the descriptive statistics: Vehicle name object price float64 dtype: object
En sachant comment obtenir le type de données de chaque colonne, nous pouvons effectuer efficacement diverses opérations de données et travaux d'analyse. Chaque méthode présente ses propres avantages et inconvénients selon la méthode ou la fonction utilisée. Vous pouvez choisir la méthode souhaitée en fonction de la complexité souhaitée de l’expression et de vos préférences personnelles de codage.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!