Ajout de dates manquantes au cadre de données Pandas
Lorsque vous travaillez avec des données d'événement, il est courant de rencontrer des dates manquantes. Cela peut poser un problème lors du traçage si le nombre d'événements à une date donnée ne correspond pas à la plage de dates souhaitée. Pour résoudre ce problème, il est nécessaire d'ajouter les dates manquantes et de leur attribuer un nombre nul.
Un moyen efficace d'y parvenir consiste à utiliser la fonction Series.reindex(). Cette fonction nous permet de réaligner la série en fonction de l'index souhaité, en spécifiant une fill_value pour les dates manquantes. Par exemple :
import pandas as pd # Create a date range index idx = pd.date_range('09-01-2013', '09-30-2013') # Create a series with existing dates s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) # Reindex with missing dates and fill with 0 s = s.reindex(idx, fill_value=0) # Print the updated series print(s)
Cela affichera une série avec la plage de dates complète, y compris les dates manquantes avec un nombre de zéro :
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
En utilisant la fonction reindex(), nous Nous avons effectivement ajouté les dates manquantes et veillé à ce que la série et l'index de plage de dates contiennent le même nombre d'éléments, ce qui nous permet de les tracer de manière transparente.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!