PySpark 文字列を日付形式に変換する
文字列として保存された日付を処理する場合、さらなる分析を容易にするために、適切な日付形式への変換が重要になります。 。ここでは、PySpark を使用して「MM-dd-yyyy」形式の文字列列を日付列に変換する解決策を示します。
問題を解決して文字列列を日付に正常に変換するには、to_date 関数を使用することを検討してください。適切な形式仕様を使用して。次のコード スニペットは、正しいアプローチを示しています:
df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Spark 2.2 の場合、入力形式の仕様をサポートする to_timestamp 関数を使用した代替アプローチが存在します:
from pyspark.sql.functions import to_timestamp df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
以上がPySpark の文字列列を日付形式に変換するには?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。