Konvertieren einer Pandas-Spalte mit fehlenden Werten in einen Ganzzahl-D-Typ
In Pandas führt die Umwandlung einer Spalte mit fehlenden Werten (NaNs) in eine Ganzzahl häufig dazu Fehler. Dies liegt daran, dass Integer-Typen standardmäßig keine fehlenden Informationen speichern können. Allerdings bietet Pandas jetzt eine Lösung durch nullable Integer-Datentypen.
Nullable Integer Dtype
In den Versionen 0.24. In Pandas können Sie ganzzahlige Datentypen verwenden, die NULL-Werte zulassen, um ganzzahlige Werte mit möglicherweise fehlenden Werten darzustellen. Dieser Datentyp wird als arrays.IntegerArray implementiert und erfordert eine explizite Angabe beim Erstellen eines Arrays oder einer Serie:
arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) pd.Series(arr) 0 1 1 2 2 NaN dtype: Int64
Spalte in Nullable Integer konvertieren
Zum Konvertieren einer Spalte in Verwenden Sie für einen ganzzahligen Datentyp, der NULL-Werte zulässt, die folgende Syntax:
df['myCol'] = df['myCol'].astype('Int64')
Durch Angabe des Int64-D-Typs Sie informieren Pandas ausdrücklich darüber, dass die Spalte einen ganzzahligen Datentyp haben sollte, der fehlende Werte (NaN) aufnehmen kann. Mit diesem Ansatz können Sie ganzzahlige Werte mit fehlenden Informationen darstellen, ohne dass Typkonvertierungsfehler auftreten.
Das obige ist der detaillierte Inhalt vonWie kann ich eine Pandas-Spalte mit NaN-Werten in einen Integer-Datentyp konvertieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!