Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?

Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?

Barbara Streisand
Lepaskan: 2024-11-25 07:33:37
asal
549 orang telah melayarinya

How to Convert a PySpark String Column to a Date Format?

Menukar PySpark String kepada Format Tarikh

Apabila mengendalikan tarikh yang disimpan sebagai rentetan, penukaran kepada format tarikh yang betul menjadi penting untuk memudahkan analisis selanjutnya . Berikut ialah penyelesaian untuk menukar lajur rentetan dalam format "MM-dd-yyyy" kepada lajur tarikh menggunakan PySpark.

Untuk menyelesaikan isu dan berjaya menukar lajur rentetan kepada tarikh, pertimbangkan untuk menggunakan fungsi to_date bersama dengan spesifikasi format yang sesuai. Coretan kod berikut menunjukkan pendekatan yang betul:

df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Salin selepas log masuk

Untuk Spark 2.2 , pendekatan alternatif wujud menggunakan fungsi to_timestamp, yang menyokong spesifikasi format input:

from pyspark.sql.functions import to_timestamp
df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan