將PySpark 字串轉換為日期格式
處理儲存為字串的日期時,轉換為正確的日期格式對於促進進一步分析至關重要。以下是使用 PySpark 將格式為「MM-dd-yyyy」的字串列轉換為日期列的解決方案。
要解決該問題並成功將字串列轉換為日期,請考慮使用 to_date 函數具有適當的格式規格。以下程式碼片段示範了正確的方法:
df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
對於 Spark 2.2 ,存在使用 to_timestamp 函數的替代方法,該方法支援輸入格式的規格:
from pyspark.sql.functions import to_timestamp df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
以上是如何將 PySpark 字串列轉換為日期格式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!