Beim Umgang mit Zeitreihendaten in Pandas ist es oft notwendig, Zeilen basierend auf bestimmten Datumsbereichen zu filtern. In diesem Artikel wird erläutert, wie Sie einen Pandas-DataFrame effizient filtern, um nur Zeilen innerhalb der nächsten zwei Monate beizubehalten.
Wenn die Spalte „Datum“ als Index des DataFrame festgelegt ist können Sie die beschriftungsbasierte Indizierung oder die Positionsindizierung verwenden, um die gewünschten Zeilen zu extrahieren. Um beispielsweise Zeilen mit Datumsangaben innerhalb der nächsten zwei Monate auszuwählen:
df.loc['2023-03-01':'2023-04-30'] # Label-based indexing df.iloc[pd.date_range('2023-03-01', '2023-04-30', freq='D').index] # Positional indexing
Wenn die Spalte „Datum“ nicht der Index ist, haben Sie zwei Möglichkeiten:
df[(df['date'] >= '2023-03-01') & (df['date'] <= '2023-04-30')]
Beachten Sie, dass der .ix-Accessor vorhanden ist veraltet und es wird empfohlen, stattdessen .loc oder .iloc zu verwenden.
Das obige ist der detaillierte Inhalt vonWie filtere ich Pandas-DataFrames nach Datumsbereich für die nächsten zwei Monate?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!