Pandas Dataframe에 누락된 날짜 추가
이벤트 데이터로 작업할 때 누락된 날짜가 발생하는 것이 일반적입니다. 특정 날짜의 이벤트 수가 원하는 날짜 범위와 일치하지 않으면 플롯할 때 문제가 발생할 수 있습니다. 이 문제를 해결하려면 누락된 날짜를 추가하고 해당 날짜에 0의 개수를 할당해야 합니다.
이를 달성하는 효과적인 방법 중 하나는 Series.reindex() 함수를 사용하는 것입니다. 이 함수를 사용하면 누락된 날짜에 대해 fill_value를 지정하여 원하는 인덱스를 기반으로 시리즈를 다시 정렬할 수 있습니다. 예를 들어:
import pandas as pd # Create a date range index idx = pd.date_range('09-01-2013', '09-30-2013') # Create a series with existing dates s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) # Reindex with missing dates and fill with 0 s = s.reindex(idx, fill_value=0) # Print the updated series print(s)
이렇게 하면 누락된 날짜와 개수가 0인 날짜를 포함하여 전체 날짜 범위가 포함된 시리즈가 출력됩니다.
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
reindex() 함수를 사용하면 누락된 날짜를 효과적으로 추가하고 시리즈와 날짜 범위 색인의 요소 수가 동일한지 확인하여 원활하게 도표화할 수 있었습니다.
위 내용은 Pandas DataFrame에 누락된 날짜를 추가하고 0으로 채우려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!