Das Durchlaufen der Zeilen eines Pandas DataFrame kommt häufig vor, wenn tabellarische Daten bearbeitet werden. In diesem Artikel werden zwei Methoden zur Erfüllung dieser Aufgabe untersucht und die Zusammensetzung von Zeilenobjekten erläutert.
Pandas stellt einen effizienten DataFrame.iterrows-Generator bereit, der sowohl den Index als auch die Zeile zurückgibt als Serie für jede Beobachtung. Diese Methode ermöglicht den direkten Zugriff auf Spaltenwerte mithilfe des Index der Zeile:
import pandas as pd df = pd.DataFrame({'c1': [10, 11, 12], 'c2': [100, 110, 120]}) for index, row in df.iterrows(): print(row['c1'], row['c2'])
Dieses Snippet gibt Folgendes aus:
10 100 11 110 12 120
Während der Iteration über Pandas-Objekte ist im Allgemeinen ein praktischer Ansatz, kann aber im Vergleich zu vektorisierten Operationen langsam sein. Erwägen Sie für maximale Leistung alternative Techniken wie:
Über iterrows() hinaus bietet Pandas weitere Zeileniterationsmethoden wie:
Das obige ist der detaillierte Inhalt vonWie kann ich Pandas DataFrame-Zeilen effizient durchlaufen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!