Sélectionner les lignes du bloc de données dans une plage de dates spécifiée
Problème :
Comment créer un nouveau DataFrame à partir d'un fichier CSV qui contient uniquement des lignes avec des dates comprises dans une plage spécifiée ou entre deux dates.
Solution 1 : Utiliser un masque booléen
Assurez-vous que la colonne de date du DataFrame est une série avec un type de données datetime64[ns]. Créez un masque booléen en comparant les dates aux dates de début et de fin. Utilisez ce masque pour sélectionner les lignes et soit créer un nouveau DataFrame, soit écraser celui existant.
Exemple :
df['date'] = pd.to_datetime(df['date']) mask = (df['date'] > start_date) & (df['date'] <= end_date) df_filtered = df.loc[mask]
Solution 2 : Utiliser un DatetimeIndex
Convertissez la colonne de date en DatetimeIndex. Cela vous permet de sélectionner des lignes par date à l'aide de df.loc[start_date:end_date].
Exemple :
import pandas as pd df['date'] = pd.date_range('2000-1-1', periods=200, freq='D') df = df.set_index(['date']) df_filtered = df.loc['2000-6-1':'2000-6-10']
Remarques supplémentaires :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!