PySpark 문자열을 날짜 형식으로 변환
문자열로 저장된 날짜를 처리할 때 추가 분석을 용이하게 하려면 적절한 날짜 형식으로 변환하는 것이 중요합니다. . 다음은 PySpark를 사용하여 "MM-dd-yyyy" 형식의 문자열 열을 날짜 열로 변환하는 솔루션입니다.
문제를 해결하고 문자열 열을 날짜로 성공적으로 변환하려면 to_date 함수를 함께 사용하는 것이 좋습니다. 적절한 형식 사양을 사용합니다. 다음 코드 조각은 올바른 접근 방식을 보여줍니다.
df.select(to_date(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
Spark 2.2의 경우 입력 형식 사양을 지원하는 to_timestamp 함수를 사용하는 대체 접근 방식이 있습니다.
from pyspark.sql.functions import to_timestamp df.select(to_timestamp(df.STRING_COLUMN, "MM-dd-yyyy").alias("new_date")).show()
위 내용은 PySpark 문자열 열을 날짜 형식으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!