Pandas est un outil de traitement et d'analyse de données couramment utilisé en Python. Il fournit une série de méthodes pratiques pour lire et traiter des fichiers Excel. Cet article présentera plusieurs méthodes courantes permettant aux Pandas de lire des fichiers Excel et fournira des exemples de code spécifiques pour aider les lecteurs à mieux les comprendre et les appliquer.
1. Utilisez la fonction read_excel() de Pandas pour lire les fichiers Excel
Pandas fournit la fonction read_excel(), qui peut lire directement les fichiers Excel et les convertir en objets DataFrame. L'utilisation de base de cette fonction est la suivante :
import pandas as pd # 读取Excel文件 df = pd.read_excel('filename.xlsx', sheetname='sheet1')
Parmi eux, 'filename.xlsx' est le nom du fichier Excel à lire, qui peut être un chemin relatif ou un chemin absolu. Le paramètre sheetname est utilisé pour spécifier le nom de la feuille de calcul à lire, qui peut être un nom ou un index de feuille de calcul spécifique.
Pour faciliter la démonstration, nous créons un exemple de fichier Excel nommé data.xlsx
avec le contenu suivant :
Nom Âge Sexe
Zhang San 25 ans Homme
Li Si 30 ans Femme
Wang Wu 28 ans Homme
Ensuite, nous utilisons read_excel() function Lisez et imprimez les données :
import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheetname='Sheet1') # 打印数据 print(df)
Les résultats en cours sont les suivants :
Nom Âge Sexe
0 Zhang San 25 Homme
1 Li Si 30 Femme
2 Wang Wu 28 Homme
Après avoir lu le fichier Excel, vous pouvez effectuer diverses opérations sur le traitement et l'analyse des données de l'objet DataFrame.
2. Lire les données de plusieurs feuilles de calcul
Si un fichier Excel contient plusieurs feuilles de calcul, vous pouvez lire les données de la feuille de calcul spécifiée en spécifiant le paramètre sheetname. À ce stade, la fonction read_excel() renverra un dictionnaire avec le nom de la feuille de calcul comme clé et l'objet DataFrame correspondant comme valeur. Un exemple est le suivant :
import pandas as pd # 读取Excel文件的所有工作表 dfs = pd.read_excel('filename.xlsx', sheetname=None) # 打印所有工作表的数据 for sheetname, df in dfs.items(): print(sheetname, ": ", df)
3. Spécifiez la plage de colonnes pour lire les données
Parfois, nous pouvons vouloir lire uniquement une partie des données de la colonne dans le fichier Excel. À ce stade, vous pouvez limiter la plage de colonnes à lire en spécifiant le paramètre usecols. Un exemple est le suivant :
import pandas as pd # 读取Excel文件的指定列范围 df = pd.read_excel('filename.xlsx', usecols='A:C') # 打印数据 print(df)
4. Gestion des valeurs nulles
Lors de la lecture de fichiers Excel, vous rencontrez souvent des situations contenant des valeurs nulles. Pandas fournit la fonction fillna() pour gérer facilement cette situation. Un exemple est le suivant :
import pandas as pd # 读取Excel文件并处理空值 df = pd.read_excel('filename.xlsx') df.fillna(value=0, inplace=True) # 打印数据 print(df)
Dans l'exemple ci-dessus, la fonction fillna() est utilisée pour remplir la valeur nulle avec 0, et inplace=True signifie la modifier directement sur l'objet DataFrame d'origine.
Ci-dessus sont plusieurs méthodes courantes et exemples de codes pour lire des fichiers Excel avec Pandas. Les lecteurs peuvent choisir la méthode appropriée en fonction de leurs propres besoins pour explorer et appliquer davantage les fonctions de traitement et d'analyse des données de Pandas.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!