Scénario :
Les données d'un Pandas DataFrame existent souvent dans différents formats, y compris les chaînes. Lorsque vous travaillez avec des données temporelles, les horodatages peuvent initialement apparaître sous forme de chaînes, mais doivent être convertis au format datetime pour une analyse précise.
Conversion et filtrage basés sur la date
Pour convertissez une colonne de chaîne en datetime dans Pandas, utilisez la fonction to_datetime. Cette fonction prend un argument de format qui spécifie le format attendu de la colonne de chaîne.
Exemple :
Considérez le DataFrame suivant avec une colonne (Mycol) contenant des chaînes dans un format personnalisé :
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
Pour convertir cette colonne en datetime, utilisez ce qui suit code :
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
L'argument de format spécifié correspond au format de chaîne donné. Après la conversion, la colonne Mycol contiendra désormais des objets datetime.
Filtrage basé sur la date
Une fois la colonne convertie en datetime, vous pouvez effectuer des opérations de filtrage basées sur la date . Par exemple, pour sélectionner des lignes dont la date se situe dans une plage spécifique :
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
Le filtered_df résultant inclura uniquement les lignes où la valeur de la colonne Mycol se situe entre les dates spécifiées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!