Maison > développement back-end > Tutoriel Python > Tutoriel Pandas : Comment utiliser cette bibliothèque pour lire des fichiers Excel

Tutoriel Pandas : Comment utiliser cette bibliothèque pour lire des fichiers Excel

PHPz
Libérer: 2024-01-10 19:54:43
original
1085 Les gens l'ont consulté

Tutoriel Pandas : Comment utiliser cette bibliothèque pour lire des fichiers Excel

Tutoriel Pandas : Comment utiliser cette bibliothèque pour lire des fichiers Excel, des exemples de code spécifiques sont requis

Présentation :
Pandas est un outil de traitement et d'analyse de données puissant et flexible qui est largement utilisé dans les domaines de la science des données et des données. traitement. Une application courante consiste à lire et à traiter des fichiers Excel. Ce didacticiel vous montrera comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et fournira des exemples de code spécifiques.

Installer Pandas :
Tout d'abord, assurez-vous que la bibliothèque Pandas est installée. Vous pouvez installer Pandas depuis la ligne de commande en utilisant la commande suivante :

pip install pandas
Copier après la connexion

Lecture d'un fichier Excel :
Avant de commencer, assurez-vous d'avoir déjà un fichier Excel avec lequel travailler. Supposons que votre fichier Excel s’appelle « exemple.xlsx ».

Tout d'abord, importez la bibliothèque Pandas et les modules requis :

import pandas as pd
Copier après la connexion

Ensuite, utilisez la fonction pd.read_excel() pour lire le fichier Excel. Cette fonction accepte un nom de fichier comme paramètre et renvoie un objet Pandas DataFrame. pd.read_excel()函数读取Excel文件。该函数接受文件名作为参数,返回一个Pandas数据框(DataFrame)对象。

data = pd.read_excel('example.xlsx')
Copier après la connexion

数据框是一个二维表格,包含行和列。通过data.head()方法,您可以查看数据框的前几行,默认显示前5行。

print(data.head())
Copier après la connexion

您可以通过传递整数参数来指定显示的行数。

print(data.head(10))
Copier après la connexion

如果您希望查看所有行的数据,可以使用data对象本身。

print(data)
Copier après la connexion

读取特定Sheet:
在读取Excel文件时,如果您的文件包含多个Sheet,您可以通过在pd.read_excel()函数中传递sheet_name参数来读取特定的Sheet。

data = pd.read_excel('example.xlsx', sheet_name='Sheet1')
Copier après la connexion

指定列和行范围:
有时候,您可能只对特定的列感兴趣。您可以在读取Excel文件时,通过usecols参数指定要读取的列。

data = pd.read_excel('example.xlsx', usecols=['Column1', 'Column3'])
Copier après la connexion

此外,您还可以通过skiprows参数指定要跳过的行数,以及nrows参数指定读取的行范围。

data = pd.read_excel('example.xlsx', skiprows=2, nrows=10)
Copier après la connexion

保存为Excel文件:
一旦您完成了对Excel文件的读取和处理,您可能希望将结果保存为一个新的Excel文件。您可以使用to_excel()方法来实现这一点。

data.to_excel('output.xlsx', index=False)
Copier après la connexion

to_excel()方法接受文件名作为参数,并使用数据框中的数据创建一个新的Excel文件。通过传递index=False参数,可以避免将索引列保存到Excel文件中。

更多操作:
除了上述操作之外,Pandas还提供了许多其他强大的功能,以帮助您处理和分析Excel数据。例如,您可以使用Pandas的数据处理方法对数据进行排序、过滤、分组等操作。您可以使用describe()方法获取数据的统计摘要信息,或者使用plot()rrreee

Un bloc de données est un tableau bidimensionnel contenant des lignes et des colonnes. Grâce à la méthode data.head(), vous pouvez afficher les premières lignes du bloc de données. Les 5 premières lignes sont affichées par défaut.

rrreee
Vous pouvez spécifier le nombre de lignes à afficher en passant un argument entier.

rrreee🎜Si vous souhaitez voir les données de toutes les lignes, vous pouvez utiliser l'objet data lui-même. 🎜rrreee🎜Lire une feuille spécifique : 🎜Lors de la lecture d'un fichier Excel, si votre fichier contient plusieurs feuilles, vous pouvez passer sheet_name dans le paramètre <code>pd.read_excel() code> à. lire une feuille spécifique. 🎜rrreee🎜Spécifiez les plages de colonnes et de lignes : 🎜Parfois, vous n'êtes peut-être intéressé que par des colonnes spécifiques. Vous pouvez spécifier les colonnes à lire via le paramètre usecols lors de la lecture d'un fichier Excel. 🎜rrreee🎜 De plus, vous pouvez également spécifier le nombre de lignes à parcourir avec le paramètre skiprows et le paramètre nrows pour spécifier la plage de lignes à lire. 🎜rrreee🎜Enregistrer sous forme de fichier Excel : 🎜Une fois que vous avez fini de lire et de traiter le fichier Excel, vous souhaiterez peut-être enregistrer les résultats dans un nouveau fichier Excel. Vous pouvez utiliser la méthode to_excel() pour y parvenir. 🎜rrreee🎜 La méthode to_excel() accepte un nom de fichier comme paramètre et crée un nouveau fichier Excel en utilisant les données du bloc de données. En passant le paramètre index=False, vous pouvez éviter d'enregistrer la colonne d'index dans le fichier Excel. 🎜🎜Plus d'opérations : 🎜En plus des opérations ci-dessus, Pandas fournit également de nombreuses autres fonctions puissantes pour vous aider à traiter et analyser les données Excel. Par exemple, vous pouvez utiliser les méthodes de traitement des données de Pandas pour trier, filtrer, regrouper et autres opérations sur les données. Vous pouvez utiliser la méthode describe() pour obtenir des informations statistiques récapitulatives sur les données, ou utiliser la méthode plot() pour tracer les données. 🎜🎜Conclusion : 🎜Grâce à cet article, vous avez appris à utiliser la bibliothèque Pandas pour lire des fichiers Excel et fourni des exemples de code spécifiques. Vous pouvez désormais commencer à utiliser la bibliothèque Pandas pour traiter et analyser les données Excel, en explorant davantage de fonctionnalités et de méthodes adaptées à vos besoins. Je vous souhaite du succès dans votre parcours de traitement et d’analyse des données ! 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal