Sélection efficace des feuilles de calcul avec Pandas
Lorsque vous travaillez avec de grandes feuilles de calcul, il est crucial d'optimiser votre code pour éviter un chargement de données inutile. Cette question aborde le problème de la lecture de feuilles de calcul spécifiques dans un fichier Excel à l'aide de pd.read_excel() sans recharger l'intégralité du fichier plusieurs fois.
Pour résoudre ce problème, la solution réside dans l'utilisation de pd.ExcelFile. Cette classe lit le fichier Excel une fois et fournit une interface pour accéder aux feuilles de calcul individuelles. Voici un exemple :
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
Il est important de noter que l'intégralité du fichier est lu lors de l'appel ExcelFile(). Cependant, les appels ultérieurs à pd.read_excel() avec le même objet fichier nécessitent uniquement l'accès à la feuille de calcul spécifiée.
L'argument sheet_name dans pd.read_excel() accepte une chaîne pour le nom de la feuille, un entier pour la feuille numéro, ou une liste de noms ou d’indices. La valeur par défaut est 0, indiquant la première feuille de calcul.
Pour charger toutes les feuilles, spécifiez sheet_name=None. Cela renvoie un dictionnaire où les clés sont des noms/index de feuilles et les valeurs sont des blocs de données correspondants.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!