Leistungsprobleme mit Pandas-Iterrows
Iterrows, eine Pandas-Funktion für zeilenweise Iteration, weist Leistungsmängel auf. Während das Problem möglicherweise mit gemischten D-Typen im Datenrahmen zusammenhängt, weisen selbst einfache Szenarien ohne dieses Problem erhebliche Leistungsverzögerungen auf.
Vektorisierte Vorgänge wie Apply übertreffen häufig Iterrows, was Fragen zur Notwendigkeit von Row-By aufwirft -Zeilen-Iteration. Es gibt jedoch Fälle, in denen Iterrows unvermeidbar bleiben.
Gründe für Iterrows-Leistungsprobleme
Im Allgemeinen ist Iterrows aufgrund der Leistungsmerkmale weniger effizient als Vektorisierung, Anwendung und Itertuples :
Richtlinien für optimale Leistung
Um die Leistung zu optimieren, beachten Sie die folgenden Richtlinien:
Das obige ist der detaillierte Inhalt vonWarum ist Pandas „iterrows' so langsam und wie kann ich die Leistung verbessern?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!