Szenario:
Daten innerhalb eines Pandas DataFrame liegen oft in verschiedenen Formaten vor, inklusive Saiten. Bei der Arbeit mit zeitlichen Daten erscheinen Zeitstempel zunächst möglicherweise als Zeichenfolgen, müssen jedoch für eine genaue Analyse in ein Datum/Uhrzeit-Format konvertiert werden.
Konvertierung und Filterung basierend auf dem Datum
An Um in Pandas eine Zeichenfolgenspalte in datetime umzuwandeln, verwenden Sie die Funktion to_datetime. Diese Funktion benötigt ein Formatargument, das das erwartete Format der Zeichenfolgenspalte angibt.
Beispiel:
Betrachten Sie den folgenden DataFrame mit einer Spalte (Mycol), die Zeichenfolgen in a enthält Benutzerdefiniertes Format:
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
Um diese Spalte in datetime zu konvertieren, verwenden Sie Folgendes Code:
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
Das angegebene Formatargument entspricht dem angegebenen Zeichenfolgenformat. Nach der Konvertierung enthält die Mycol-Spalte nun Datetime-Objekte.
Datumsbasierte Filterung
Sobald die Spalte in Datetime konvertiert wurde, können Sie datumsbasierte Filtervorgänge durchführen . Um beispielsweise Zeilen auszuwählen, deren Datum in einen bestimmten Bereich fällt:
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
Die resultierende filtered_df enthält nur die Zeilen, in denen der Mycol-Spaltenwert zwischen den angegebenen Daten liegt.
Das obige ist der detaillierte Inhalt vonWie konvertiere ich eine Pandas DataFrame-Spalte in das DateTime-Format und filtere nach Datum?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!