Zeilen mit NaN-Werten aus einem Pandas-DataFrame entfernen
Ein Pandas-DataFrame kann fehlende Werte enthalten, die als NaN dargestellt werden. Dies kann bei der Manipulation von Daten zu Herausforderungen führen. In diesem Artikel geht es darum, wie man effizient Zeilen entfernt, in denen eine bestimmte Spalte NaN-Werte enthält.
Problem:
Betrachten Sie den folgenden DataFrame, in dem wir nur Zeilen behalten möchten, in denen das „ Die EPS-Spalte ist nicht vorhanden NaN:
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
Lösung:
Um Zeilen mit NaN-Werten in der Spalte „EPS“ zu entfernen, können wir die Funktion notna() verwenden. Diese Funktion erstellt eine boolesche Maske, in der „True“ Nicht-NaN-Werte darstellt.
df = df[df['EPS'].notna()]
Dieser Vorgang wählt nur die Zeilen aus, in denen „EPS“ nicht NaN ist, was zu dem folgenden DataFrame führt:
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
Durch die Verwendung der Funktion notna() filtern wir effektiv die Zeilen heraus, die NaN-Werte in der angegebenen Spalte enthalten.
Das obige ist der detaillierte Inhalt vonWie entferne ich Zeilen mit NaN-Werten in einer bestimmten Pandas DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!