Bei der Arbeit mit Pandas DataFrames ist es wichtig, fehlende Daten effektiv zu verarbeiten. Eine häufige Aufgabe besteht darin, Zeilen zu entfernen, in denen eine bestimmte Spalte NaN-Werte enthält.
Bedenken Sie den folgenden DataFrame:
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
Das Ziel besteht darin, alle Zeilen zu entfernen, in denen die Spalte „EPS“ NaN-Werte enthält, was zu Folgendem führt DataFrame:
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
Um diese Aufgabe zu erfüllen, können Sie die Methode df.dropna() verwenden, die Zeilen mit einem beliebigen Wert ablegt in der angegebenen Spalte ist NaN. In diesem Fall möchten Sie jedoch nur Zeilen entfernen, in denen die Spalte „EPS“ NaN enthält. Um dies speziell auf die Spalte „EPS“ anzuwenden, verwenden Sie den folgenden Code:
df = df[df['EPS'].notna()]
Dieser Code überprüft jede Zeile im DataFrame, ob der Wert in der Spalte „EPS“ nicht NaN ist und ob dies der Fall ist nicht, es behält die Zeile. Wenn es NaN ist, wird die Zeile gelöscht. Der resultierende DataFrame enthält nur die Zeilen, in denen die Spalte „EPS“ Nicht-NaN-Werte enthält.
Das obige ist der detaillierte Inhalt vonWie entferne ich Zeilen mit NaN-Werten aus einer bestimmten Pandas DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!