시계열 데이터로 작업할 때 특정 날짜에 해당하는 이벤트가 없는 상황이 발생할 수 있습니다. 이러한 데이터를 구성하면 서로 다른 계열 간에 날짜 범위가 일치하지 않는 경우 불일치가 발생할 수 있습니다.
이 문제를 해결하는 한 가지 방법은 누락된 날짜를 0으로 데이터 프레임에 추가하는 것입니다. 이렇게 하면 이벤트가 없는 날짜에도 전체 기간을 나타내는 완전한 그래프가 보장됩니다.
이를 달성하려면 Series.reindex 방법을 활용할 수 있습니다. 이 방법을 사용하면 계열의 색인을 조정하여 다른 색인과 일치시킬 수 있습니다. 귀하의 경우에는 원하는 날짜 범위를 기준으로 시리즈를 다시 색인화하여 해당 범위 내의 모든 날짜를 포함하도록 합니다. 누락된 날짜는 0으로 채워집니다.
다음은 이 접근 방식을 보여주는 예입니다.
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0) print(s)
이 코드는 다음 출력을 생성합니다.
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 ...
알 수 있듯이 누락된 날짜(09-04 및 09-05)가 0 카운트인 계열에 추가되어 완전한 그래프가 생성되었습니다. 30일 중. 재색인 방법을 사용하면 날짜 범위 불일치를 효과적으로 처리하고 시계열 데이터에 대한 포괄적인 시각화를 생성할 수 있습니다.
위 내용은 Pandas DataFrame에서 누락된 날짜를 0으로 채우는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!