Ersetzen von NaNs durch vorhergehende oder nächste Werte in Pandas-DataFrames
Beim Umgang mit Pandas-DataFrames werden fehlende Daten als NaNs (keine Zahl) dargestellt. kann eine Herausforderung für die Datenanalyse darstellen. Eine häufige Aufgabe besteht darin, diese NaNs durch geeignete Werte zu ersetzen, die aus vorhandenen Daten abgeleitet werden. Ein einfacher Ansatz besteht darin, den DataFrame zu durchlaufen und Werte explizit zu ändern. Pandas bietet jedoch effizientere Lösungen, die die Verwendung von Schleifen vermeiden.
Vorwärtsfüllung (ffill)
Um NaNs durch den ersten Nicht-NaN-Wert darüber zu ersetzen Wenn Sie dieselbe Spalte verwenden möchten, verwenden Sie die Methode fillna mit der Option ffill (Vorwärtsfüllung). Diese Methode gibt die letzte gültige Beobachtung an nachfolgende gültige Beobachtungen weiter.
import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) df.fillna(method='ffill')
Ausgabe:
0 1 2 0 1 2 3 1 4 2 3 2 4 2 9
Zusätzliche Überlegungen
df.fillna(method='ffill', inplace=True)
Das obige ist der detaillierte Inhalt vonWie kann man NaN-Werte in Pandas-DataFrames mithilfe von „ffill' und „bfill' effizient ersetzen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!