Maison > développement back-end > Tutoriel Python > Comment convertir une colonne de chaîne PySpark en colonne de date ?

Comment convertir une colonne de chaîne PySpark en colonne de date ?

Barbara Streisand
Libérer: 2024-12-01 11:26:10
original
1034 Les gens l'ont consulté

How to Convert a PySpark String Column to a Date Column?

Conversion de la chaîne PySpark au format de date

Vous disposez d'un DataFrame PySpark avec une colonne de chaîne au format MM-jj-aaaa et vous il faut le convertir en date column.

Solution :

Pour convertir une colonne de chaîne PySpark en colonne de date, vous pouvez utiliser la fonction to_date. Cependant, si vous utilisez une ancienne version de Spark (< 2.2), vous pouvez suivre l'approche alternative ci-dessous :

Approche alternative pour Spark < 2.2 :

Utilisez une combinaison des fonctions unix_timestamp et from_unixtime :

from pyspark.sql.functions import unix_timestamp, from_unixtime

# Example DataFrame with string dates
df = spark.createDataFrame(
    [("11/25/1991",), ("11/24/1991",), ("11/30/1991",)],
    ["date_str"]
)

# Convert to timestamps
df2 = df.select(
    "date_str",
    from_unixtime(unix_timestamp("date_str", "MM/dd/yyy")).alias("date")
)
Copier après la connexion

Cela créera une nouvelle colonne nommée date avec des objets date convertis à partir de la colonne chaîne.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal