Beim Umgang mit Datensätzen stößt man häufig auf im Excel-Stil formatierte Datumsangaben, bei denen eine Gleitkommazahl die Zahl darstellt Anzahl der Tage seit einem bestimmten Epochendatum. Pandas bietet eine bequeme Möglichkeit, diese Zahlen in reguläre Datums-/Uhrzeitobjekte umzuwandeln und so eine nahtlose Datenbearbeitung und -analyse zu ermöglichen.
In dem im bereitgestellten Inhalt beschriebenen Fall besteht das Ziel darin, eine XML-Datei mit Datumsangaben im Excel-Stil zu analysieren. wie 42580.3333333333. Um dies zu erreichen, bietet Pandas eine unkomplizierte Lösung mit TimedeltaIndex:
import pandas as pd import datetime as dt df = pd.DataFrame({'date': [42580.3333333333, 10023]}) df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)
Dieser Code erstellt einen TimedeltaIndex aus den Float-Werten und fügt ihn zum skalaren Datum/Uhrzeit-Wert für den 1. Januar 1900 hinzu, wodurch die Excel-Daten effektiv in Datum/Uhrzeit konvertiert werden Objekte.
Es ist jedoch wichtig zu beachten, dass Excel ein etwas anderes Epochendatum als Standard-Datum/Uhrzeit-Objekte verwendet die daraus resultierenden Termine müssen ggf. entsprechend angepasst werden. Um dies zu berücksichtigen, kann der Code wie folgt geändert werden:
df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)
Dadurch wird sichergestellt, dass Datumsangaben im Excel-Stil in die richtigen Datums-/Uhrzeitwerte konvertiert werden, was eine genaue Datenverarbeitung und -analyse innerhalb des Pandas-Frameworks ermöglicht.
Das obige ist der detaillierte Inhalt vonWie können Pandas Daten im Excel-Stil effizient analysieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!