Pilih Baris DataFrame Antara Dua Tarikh
Pengenalan
Apabila bekerja dengan data siri masa , selalunya perlu memilih baris tertentu berdasarkan julat tarikh. Artikel ini meneroka dua kaedah untuk mencapai ini dalam DataFrames panda.
Kaedah 1: Boolean Mask
Pastikan lajur tarikh ialah Siri dengan dtype datetime64[ns]:
df['date'] = pd.to_datetime(df['date'])
Buat topeng boolean menggunakan operator perbandingan dengan tarikh mula dan tamat:
mask = (df['date'] > start_date) & (df['date'] <= end_date)
Pilih sub-DataFrame menggunakan topeng:
df.loc[mask]
Kaedah 2: DatetimeIndex
Tetapkan lajur tarikh sebagai indeks:
df = df.set_index(['date'])
Potong DataFrame menggunakan julat tarikh:
df.loc[start_date:end_date]
Contoh
Pertimbangkan DataFrame dengan lajur tarikh. Kod berikut menggunakan kaedah topeng boolean untuk memilih baris antara '2000-06-01' dan '2000-06-10':
import pandas as pd df = pd.DataFrame({ 'date': pd.date_range('2000-1-1', periods=200, freq='D'), 'value': np.random.rand(200) }) mask = (df['date'] > '2000-06-01') & (df['date'] <= '2000-06-10') result_df = df[mask]
Hasilnya termasuk baris dari 1 hingga 10 Jun, 2000.
Perbandingan
Atas ialah kandungan terperinci Bagaimana untuk Memilih Baris DataFrame Dengan Cekap Dalam Julat Tarikh Tertentu dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!