Pandas DataFrame의 Datetime 열에서 연도 및 월을 추출하는 작업은 간단할 수 있습니다. 위에서 설명한 문제를 다시 살펴보고 포괄적인 솔루션을 제공해 보겠습니다.
한 가지 접근 방식은 날짜/시간 열을 다시 샘플링하여 빈도별로(이 경우에는 월별) 그룹화하는 것입니다. 그러나 리샘플링 작업은 DatetimeIndex 또는 PeriodIndex 객체에만 유효하므로 제공된 코드에서 오류가 발생합니다.
또 다른 일반적인 해결 방법은 Datetime 열의 각 요소에 람다 함수를 적용하고 문자열을 분할하여 추출하는 것입니다. 연도 또는 월 부분만 표시됩니다. 그러나 이 방법은 슬라이싱 기능이 부족한 날짜/시간 열 요소의 타임스탬프 유형으로 인해 실패합니다.
대신 다음 솔루션을 권장합니다.
df['year'] = pd.DatetimeIndex(df['ArrivalDate']).year df['month'] = pd.DatetimeIndex(df['ArrivalDate']).month
또는 이 간결한 다음 구문을 사용할 수 있습니다.
df['year'] = df['ArrivalDate'].dt.year df['month'] = df['ArrivalDate'].dt.month
이 작업은 각각 다음을 포함하는 새로운 '연도' 및 '월' 열을 생성합니다. 원래 Datetime 열에서 추출된 연도 또는 월 값입니다. 이제 추출된 연도 및 월 정보가 포함된 별도의 열이 있으므로 다양한 분석 목적으로 더 쉽게 작업할 수 있습니다.
위 내용은 Pandas Datetime 열에서 연도와 월을 효율적으로 추출하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!