Datums- und Zeitspalten in Pandas kombinieren
In der Datenanalyse ist es oft notwendig, Datums- und Zeitdaten in einem einzigen Zeitstempel zu kombinieren. Pandas, eine leistungsstarke Datenbearbeitungsbibliothek in Python, bietet mehrere Möglichkeiten, dies zu erreichen.
Eine direkte Methode besteht darin, den Python-Operator „ “ zu verwenden, um die Spalten „Datum“ und „Uhrzeit“ zu verketten, wie unten gezeigt:
new_column = df['Date'] + ' ' + df['Time']
Dies führt zu einer Zeichenfolgenspalte, die die kombinierten Datums- und Uhrzeitinformationen enthält. Für Datenoperationen ist es jedoch bequemer, die Zeichenfolge in ein Datetime-Objekt zu konvertieren.
Die Verwendung von pd.to_datetime() mit den Standardeinstellungen setzt ein bestimmtes Datum-Uhrzeit-Format voraus. In diesem Fall entspricht die kombinierte Zeichenfolge jedoch nicht dem Standardformat. Daher ist es notwendig, das genaue Format anzugeben:
new_column = pd.to_datetime(new_column, format='%m-%d-%Y %H:%M:%S')
Alternativ kann man auch pd.to_datetime() mit dem auf „coerce“ gesetzten Fehlerargument verwenden, um alle Werte, die nicht geparst werden können, automatisch zu konvertieren ein Datum/Uhrzeit. Die Verwendung eines expliziteren Formats ist jedoch im Allgemeinen schneller und zuverlässiger.
Mit diesem Ansatz können die kombinierten Datums-/Uhrzeitinformationen jetzt als Datum/Uhrzeit-Spalte behandelt werden, was eine weitere Bearbeitung und Analyse in Pandas ermöglicht.
Das obige ist der detaillierte Inhalt vonWie kann ich Datums- und Zeitspalten in Pandas zu einem einzigen Zeitstempel kombinieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!