NaN-Werte in Dataframe-Spalten ersetzen
Bei der Arbeit mit DataFrames in Pandas können fehlende oder ungültige Daten durch NaN-Werte dargestellt werden. Um die Datenqualität sicherzustellen und Fehler zu vermeiden, ist es häufig erforderlich, diese NaN-Werte durch geeignete Platzhalter oder Imputationen zu ersetzen.
DataFrame.fillna()-Methode
Die einfachste Die Methode zum Ersetzen von NaN-Werten verwendet die Methode fillna(). Es nimmt einen Wert oder ein Wörterbuch als Argument und ersetzt alle NaN-Werte in den angegebenen Spalten oder im gesamten DataFrame durch den bereitgestellten Wert.
Beispiel:
import pandas as pd df = pd.DataFrame({ "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489], "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"], "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")] }) df.fillna(0)
Ausgabe:
itm Date Amount 0 420 2012-09-30 65211 1 421 2012-09-09 29424 2 421 2012-09-16 29877 3 421 2012-09-23 30990 4 421 2012-09-30 61303 5 485 2012-09-09 71781 6 485 2012-09-16 0.0 7 485 2012-09-23 11072.0 8 485 2012-09-30 113702.0 9 489 2012-09-09 64731 10 489 2012-09-16 0.0
Zusätzlich Methoden:
Während fillna() am häufigsten vorkommt, gibt es mehrere andere Methoden, die zum Ersetzen von NaN-Werten verwendet werden können:
Fazit:
Das Ersetzen von NaN-Werten in DataFrames ist für die Datenbereinigung und -manipulation unerlässlich. Durch den Einsatz der oben beschriebenen Methoden können Sie effektiv mit fehlenden oder ungültigen Daten umgehen und so die Integrität und Qualität Ihrer Datenanalyse sicherstellen.
Das obige ist der detaillierte Inhalt vonWie kann ich NaN-Werte in Pandas DataFrames effektiv ersetzen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!