Iterieren über Zeilen in Pandas-DataFrames
Bei der Arbeit mit Daten in Pandas besteht eine häufige Aufgabe darin, über die Zeilen eines DataFrames zu iterieren. Dadurch können Sie einzeln auf die Elemente jeder Zeile zugreifen.
So iterieren Sie mit iterrows()
Die bevorzugte Methode zum Iterieren über Zeilen ist die Verwendung von DataFrame.iterrows( ) Methode. Diese Methode ergibt ein Tupel für jede Zeile, das sowohl den Index als auch die Zeile als Serie enthält.
df = pd.DataFrame({'c1': [10, 11, 12], 'c2': [100, 110, 120]}) for index, row in df.iterrows(): print(row['c1'], row['c2'])
Dies gibt Folgendes aus:
10 100 11 110 12 120
Funktionsweise des Zeilenobjekts
Das Zeilenobjekt ist eine Pandas-Serie, die die Daten der Zeile darstellt. Sie können über ihre Spaltennamen oder ihren Index auf die Elemente zugreifen.
Alternativen zu iterrows()
Es gibt alternative Methoden, mit denen Sie über Zeilen iterieren können. aber sie sind im Allgemeinen weniger effizient.
Überlegungen zur Leistung
Iteriert über Zeilen in a DataFrame kann rechenintensiv sein. Wenn die Leistung ein Problem darstellt, sollten Sie vektorisierte Lösungen verwenden oder innere Schleifen mit Cython oder NumPy schreiben.
Das obige ist der detaillierte Inhalt vonWie iteriere ich effizient über Zeilen in einem Pandas-DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!