Hinzufügen fehlender Daten zum Pandas-Datenrahmen
Bei der Arbeit mit Ereignisdaten kommt es häufig vor, dass fehlende Daten fehlen. Dies kann beim Plotten ein Problem darstellen, wenn die Anzahl der Ereignisse an einem bestimmten Datum nicht mit dem gewünschten Datumsbereich übereinstimmt. Um dies zu beheben, ist es notwendig, fehlende Daten hinzuzufügen und ihnen einen Zählwert von Null zuzuweisen.
Eine effektive Möglichkeit, dies zu erreichen, ist die Verwendung der Funktion Series.reindex(). Mit dieser Funktion können wir die Reihe basierend auf dem gewünschten Index neu ausrichten und einen Füllwert für fehlende Daten angeben. Zum Beispiel:
import pandas as pd # Create a date range index idx = pd.date_range('09-01-2013', '09-30-2013') # Create a series with existing dates s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) # Reindex with missing dates and fill with 0 s = s.reindex(idx, fill_value=0) # Print the updated series print(s)
Dadurch wird eine Reihe mit dem gesamten Datumsbereich ausgegeben, einschließlich fehlender Daten mit einer Anzahl von Null:
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
Durch die Verwendung der Funktion reindex() können wir haben die fehlenden Daten effektiv hinzugefügt und sichergestellt, dass die Serie und der Datumsbereichsindex die gleiche Anzahl von Elementen haben, sodass wir sie nahtlos darstellen können.
Das obige ist der detaillierte Inhalt vonWie kann ich fehlende Daten zu einem Pandas-DataFrame hinzufügen und sie mit Nullen füllen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!