Auswählen bestimmter Blätter für das Laden von Excel-Daten mit Pandas pd.read_excel()
Bei der Arbeit mit Excel-Arbeitsmappen mit mehreren Blättern in Python ist dies der Fall Oft wird es gewünscht, nur bestimmte Blätter in einen Pandas DataFrame zu laden, ohne die gesamte Datei neu zu laden. Dies kann insbesondere bei großen Arbeitsmappen erhebliche Verarbeitungszeit einsparen.
Mit der Funktion pd.read_excel() ist es möglich, die zu ladenden Blätter anzugeben. Dies wird erreicht, indem der Parameter sheet_name entweder als Zeichenfolge (Blattname), als Ganzzahl (Blattindex), als Liste von Blattnamen/-indizes oder als Keine angegeben wird.
Die Option zur Angabe von sheet_name=None ist besonders nützlich, wenn mehrere Blätter geladen werden müssen. In diesem Fall gibt Pandas ein Wörterbuch zurück, in dem die Schlüssel Blattnamen/-indizes und die Werte die entsprechenden DataFrames sind.
Alternativ kann die Funktion pd.ExcelFile() verwendet werden, um die gesamte Arbeitsmappe auf einmal zu öffnen. Dadurch wird die gesamte Datei in den Speicher eingelesen, es können aber auch mehrere Blätter gelesen werden, ohne dass die Datei für jedes Blatt neu geladen werden muss.
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
Beachten Sie, dass der pd.ExcelFile()-Ansatz die gesamte Arbeitsmappe in den Speicher einliest , was für sehr große Arbeitsmappen möglicherweise nicht ideal ist. In solchen Fällen kann pd.read_excel() mit der entsprechenden sheet_name-Spezifikation effizienter sein.
Das obige ist der detaillierte Inhalt vonWie kann ich mit Pandas bestimmte Tabellenblätter effizient aus einer Excel-Datei laden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!