Pandas DataFrame에서 NaN을 효율적으로 교체
데이터 분석에서 null 값이나 NaN은 문제를 일으킬 수 있습니다. 예를 들어 NaN이 포함된 pandas DataFrame을 고려해 보겠습니다.
import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
이러한 NaN을 효과적으로 처리하기 위해 NaN을 논리 값으로 바꾸는 우아한 솔루션을 찾습니다.
정방향 채우기 접근 방식
효율적이고 루프가 없는 방법 중 하나는 ffill과 함께 fillna 방법을 활용하는 것입니다. 매개변수. 이 작업은 마지막으로 관찰된 값을 앞으로 전파하여 후속 NaN을 대체합니다. 지정된 DataFrame의 경우 다음과 같은 결과가 발생합니다.
df.fillna(method='ffill')
0 1 2 0 1 2 3 1 4 2 3 2 4 2 9
역방향 채우기 접근 방식
또는 NaN을 동일한 열의 가장 가까운 값으로 바꾸지만 역방향을 원할 경우 bfill 매개변수를 사용할 수 있습니다. 이 메서드는 처음 관찰된 값을 뒤로 전파하여 NaN을 채웁니다.
내부 수정
기본적으로 fillna 메서드는 원본 DataFrame을 수정하지 않습니다. 변경 사항을 영구적으로 적용하려면 inplace=True를 사용하세요.
df.fillna(method='ffill', inplace=True)
이 작업은 df를 직접 업데이트하여 지정된 방법에 따라 모든 NaN을 바꿉니다.
결론
fillna 방법의 유연성을 활용하여 Pandas DataFrames의 NaN을 순방향 및 역방향 채우기 기술을 사용하여 분석을 위한 깨끗하고 완전한 데이터를 보장합니다.
위 내용은 Pandas DataFrame에서 NaN 값을 효율적으로 대체하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!