Menukar PySpark String kepada Format Tarikh
Apabila mengendalikan tarikh yang disimpan sebagai rentetan, penukaran kepada format tarikh yang betul menjadi penting untuk memudahkan analisis selanjutnya . Berikut ialah penyelesaian untuk menukar lajur rentetan dalam format "MM-dd-yyyy" kepada lajur tarikh menggunakan PySpark.
Untuk menyelesaikan isu dan berjaya menukar lajur rentetan kepada tarikh, pertimbangkan untuk menggunakan fungsi to_date bersama dengan spesifikasi format yang sesuai. Coretan kod berikut menunjukkan pendekatan yang betul:
df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Untuk Spark 2.2 , pendekatan alternatif wujud menggunakan fungsi to_timestamp, yang menyokong spesifikasi format input:
from pyspark.sql.functions import to_timestamp df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Atas ialah kandungan terperinci Bagaimana untuk Menukar Lajur Rentetan PySpark kepada Format Tarikh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!