pandas est une importante bibliothèque d'analyse de données en Python, qui peut simplifier le processus de lecture, de nettoyage et de traitement des données. Elle est désormais devenue la norme pour le travail d'analyse de données. Dans le processus d'analyse des données, Excel est souvent l'une des sources de données. Cet article présentera donc une méthode rapide pour lire des fichiers Excel à l'aide de pandas.
Plusieurs avantages de l'utilisation de pandas pour lire des fichiers Excel :
Alors, comment utiliser les pandas pour lire des fichiers Excel ? Ce qui suit présentera en détail l'ensemble du processus, depuis la lecture des fichiers Excel jusqu'au nettoyage et à la manipulation des données.
Tout d'abord, vous devez installer la bibliothèque pandas et les bibliothèques dépendantes associées. Vous pouvez utiliser l'instruction suivante pour installer :
pip install pandas openpyxl
Après avoir installé les bibliothèques nécessaires, vous pouvez directement utiliser pandas pour lire le fichier Excel. La méthode d'utilisation des pandas pour lire des fichiers Excel est flexible. Lors de la lecture de fichiers Excel, vous pouvez lire une seule feuille ou toutes les feuilles du fichier Excel en même temps, vous pouvez également nommer chaque colonne, définir des types de données, etc. .
Utilisez la fonction pandas.read_excel
pour lire une seule feuille à partir d'un fichier Excel. Par exemple, nous avons un fichier Excel appelé test. Si vous devez lire toutes les feuilles du fichier Excel, vous pouvez utiliser le code suivant : pandas.read_excel
函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:
import pandas as pd xls = pd.read_excel('test.xlsx', sheet_name=None)
将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。
可以使用xls.keys()
来查看所有sheet的名称,以及使用xls.values()
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.rename(columns={'原列名':'新列名'}, inplace=True)
xls.keys()
pour afficher les noms de toutes les feuilles, et utiliser xls.values()
pour afficher le contenu de toutes les feuilles. Renommer les colonnes
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.to_csv('output.csv')
Écrire des données dans un fichier
À l'aide de pandas, vous pouvez facilement écrire des données dans des fichiers Excel dans différents types de fichiers, y compris CSV. , base de données SQL, etc. Prenons l'exemple de l'écriture de données d'un fichier Excel dans un fichier CSV. L'exemple de code est le suivant :rrreee
Enregistrez les données lues dans Excel dans un DataFrame, puis utilisez la fonction to_csv du DataFrame pour écrire directement le données dans le fichier CSV. 🎜🎜Grâce aux exemples ci-dessus, j'espère que tout le monde pourra comprendre la supériorité des pandas dans la lecture et le traitement des données Excel, et pourra rapidement démarrer avec cette bibliothèque et utiliser cette compétence dans les travaux d'analyse de données ultérieurs pour gérer les données avec élégance. 🎜Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!