Menukar Jenis Lajur DataFrame daripada Rentetan kepada Datetime
Apabila berurusan dengan data berstruktur dalam DataFrame, memastikan jenis data yang betul adalah penting. Jika anda mempunyai lajur yang mengandungi tarikh dalam format rentetan (cth., "dd/mm/yyyy"), menukarkannya kepada datetime dtype menjadi penting untuk pelbagai tugas analisis data.
Penyelesaian
Pustaka Pandas menyediakan cara yang mudah untuk mengubah tarikh berasaskan rentetan kepada tarikh dtype. Fungsi pd.to_datetime() ialah pilihan pergi untuk tujuan ini. Begini cara anda boleh menggunakannya:
df['col'] = pd.to_datetime(df['col'])
Ini akan menukar lajur 'col', yang pada asalnya mengandungi rentetan dalam format "dd/mm/yyyy", kepada objek datetime.
Menentukan Format
Sekiranya tarikh anda mematuhi format tertentu, anda boleh menentukan dengan jelas ia menggunakan parameter format:
df['col'] = pd.to_datetime(df['col'], format="%m/%d/%Y")
Ini memastikan tarikh dihuraikan mengikut format yang disediakan, walaupun ia berbeza daripada "dd/mm/yyyy" lalai.
Format Masa Eropah
Jika anda menggunakan data dari wilayah Eropah yang tarikh mengikut format "dd-mm-yyyy", anda boleh menggunakan parameter dayfirst untuk menghuraikan tarikh dengan betul:
df['col'] = pd.to_datetime(df['col'], dayfirst=True)
Tetapan ini memastikan bahawa nilai hari dan bulan ditafsirkan dengan betul berdasarkan konvensyen tarikh Eropah.
Dengan menukar berasaskan rentetan anda lajur tarikh hingga dtype masa tarikh, anda mempertingkatkan ketepatan dan kebolehgunaan data anda, membolehkan tugasan analisis hiliran seperti penapisan tarikh, perbandingan dan masa analisis siri.
Atas ialah kandungan terperinci Bagaimana untuk Menukar Lajur Rentetan DataFrame kepada DateTime dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!