Maison > développement back-end > Tutoriel Python > Comment convertir une colonne de chaîne PySpark en colonne de date ?

Comment convertir une colonne de chaîne PySpark en colonne de date ?

Barbara Streisand
Libérer: 2024-12-01 11:26:10
original
945 Les gens l'ont consulté

How to Convert a PySpark String Column to a Date Column?

Conversion de la chaîne PySpark au format de date

Vous disposez d'un DataFrame PySpark avec une colonne de chaîne au format MM-jj-aaaa et vous il faut le convertir en date column.

Solution :

Pour convertir une colonne de chaîne PySpark en colonne de date, vous pouvez utiliser la fonction to_date. Cependant, si vous utilisez une ancienne version de Spark (< 2.2), vous pouvez suivre l'approche alternative ci-dessous :

Approche alternative pour Spark < 2.2 :

Utilisez une combinaison des fonctions unix_timestamp et from_unixtime :

from pyspark.sql.functions import unix_timestamp, from_unixtime

# Example DataFrame with string dates
df = spark.createDataFrame(
    [("11/25/1991",), ("11/24/1991",), ("11/30/1991",)],
    ["date_str"]
)

# Convert to timestamps
df2 = df.select(
    "date_str",
    from_unixtime(unix_timestamp("date_str", "MM/dd/yyy")).alias("date")
)
Copier après la connexion

Cela créera une nouvelle colonne nommée date avec des objets date convertis à partir de la colonne chaîne.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal