그룹별 합계 연산 결과를 DataFrame에 새 열을 생성하려고 할 때 pandas를 사용하면 일부 사용자는 새 열에서 NaN 값을 발견합니다. 주요 문제는 그룹별 합계를 개별 행에 할당하려고 할 때 발생합니다.
이 문제를 해결하는 핵심은 인덱스가 정렬된 시리즈를 반환하는 변환 함수를 사용하는 것입니다. DataFrame에. 변환을 사용하면 결과를 DataFrame에 새 열로 추가할 수 있습니다.
다음 코드 조각을 고려하세요.
import pandas as pd df = pd.DataFrame({ 'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05', '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'], 'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'], 'Data2': [11, 8, 10, 15, 110, 60, 100, 40], 'Data3': [5, 8, 6, 1, 50, 100, 60, 120] }) df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum') print(df)
출력:
Date Sym Data2 Data3 Data4 0 2015-05-08 aapl 11 5 55 1 2015-05-07 aapl 8 8 108 2 2015-05-06 aapl 10 6 66 3 2015-05-05 aapl 15 1 121 4 2015-05-08 aaww 110 50 55 5 2015-05-07 aaww 60 100 108 6 2015-05-06 aaww 100 60 66 7 2015-05-05 aaww 40 120 121
As 그림에 표시된 것처럼 새 열인 Data4의 각 행은 이제 해당 날짜 그룹에 대한 Data3 값의 합계를 반영하여 NaN의 초기 문제를 효과적으로 해결합니다. 가치가 있습니다.
위 내용은 Pandas에서 그룹화된 합계를 새 열로 추가할 때 NaN 값을 방지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!