> 백엔드 개발 > 파이썬 튜토리얼 > PySpark 문자열 열을 날짜 열로 변환하는 방법은 무엇입니까?

PySpark 문자열 열을 날짜 열로 변환하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-12-01 11:26:10
원래의
945명이 탐색했습니다.

How to Convert a PySpark String Column to a Date Column?

PySpark 문자열을 날짜 형식으로 변환

MM-dd-yyyy 형식의 문자열 열이 있는 PySpark DataFrame이 있고 날짜로 변환해야 해요

해결책:

PySpark 문자열 열을 날짜 열로 변환하려면 to_date 함수를 사용할 수 있습니다. 그러나 이전 버전의 Spark(< 2.2)를 사용하는 경우 아래의 대체 접근 방식을 따를 수 있습니다.

Spark에 대한 대체 접근 방식 < 2.2:

unix_timestamp와 from_unixtime 함수의 조합을 사용하세요.

from pyspark.sql.functions import unix_timestamp, from_unixtime

# Example DataFrame with string dates
df = spark.createDataFrame(
    [("11/25/1991",), ("11/24/1991",), ("11/30/1991",)],
    ["date_str"]
)

# Convert to timestamps
df2 = df.select(
    "date_str",
    from_unixtime(unix_timestamp("date_str", "MM/dd/yyy")).alias("date")
)
로그인 후 복사

이렇게 하면 문자열 열에서 변환된 날짜 개체가 포함된 date라는 새 열이 생성됩니다.

위 내용은 PySpark 문자열 열을 날짜 열로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿