Senario:
Data dalam Pandas DataFrame selalunya wujud dalam pelbagai format, termasuk rentetan. Apabila bekerja dengan data temporal, cap masa pada mulanya mungkin muncul sebagai rentetan tetapi perlu ditukar kepada format datetime untuk analisis yang tepat.
Penukaran dan Penapisan Berdasarkan Tarikh
Kepada tukar lajur rentetan kepada datetime dalam Pandas, gunakan fungsi to_datetime. Fungsi ini mengambil argumen format yang menentukan format jangkaan lajur rentetan.
Contoh:
Pertimbangkan DataFrame berikut dengan lajur (Mycol) yang mengandungi rentetan dalam format tersuai:
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
Untuk menukar lajur ini kepada datetime, gunakan yang berikut kod:
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
Argumen format yang ditentukan sepadan dengan format rentetan yang diberikan. Selepas penukaran, lajur Mycol kini akan mengandungi objek datetime.
Penapisan Berdasarkan Tarikh
Setelah lajur ditukar kepada datetime, anda boleh melakukan operasi penapisan berdasarkan tarikh . Contohnya, untuk memilih baris yang tarikhnya berada dalam julat tertentu:
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
Df_filter yang terhasil akan termasuk hanya baris yang nilai lajur Mycol berada di antara tarikh yang ditentukan.
Atas ialah kandungan terperinci Bagaimana untuk Menukar Lajur Pandas DataFrame kepada Format DateTime dan Tapis mengikut Tarikh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!