Ajout d'une nouvelle colonne au dataframe Pandas en tant que copie de l'index
Pour tracer un dataframe avec Matplotlib, la colonne d'index devient souvent un obstacle, car il représente le temps et ne peut pas être directement tracé. Pour surmonter ce problème, la création d'une nouvelle colonne qui réplique la colonne d'index garantit que les données souhaitées peuvent être tracées.
La question pose le défi d'ajouter une nouvelle colonne appelée « Heure » au dataframe, reflétant l'index. . Pour résoudre ce problème, plusieurs solutions sont proposées :
Méthode 1 : Réinitialisation de l'index
La méthode reset_index() ramène la trame de données à sa forme d'origine, où l'index est pas traité comme une colonne. Cela vous permet de tracer les données à l'aide de la colonne « Heure » nouvellement ajoutée.
Méthode 2 : attribution d'une nouvelle colonne
Vous pouvez également créer directement une nouvelle colonne dans votre dataframe en lui attribuant l'index. Cette approche nécessite de définir explicitement le nom de la nouvelle colonne sur « Heure » et est plus explicite que l'utilisation de reset_index().
Méthode 3 : Optimisation de la lecture CSV
Pour améliorer davantage la solution, une méthode optimisée pour lire les fichiers CSV avec des pandas est suggérée. En spécifiant les paramètres index_col et parse_dates lors de l'appel de read_csv(), vous pouvez éviter d'avoir à convertir manuellement votre colonne d'index au format datetime et à la définir comme index à l'aide de set_index().
Conseils supplémentaires
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!