Groupby를 사용하여 열 값을 기반으로 Pandas 데이터 프레임 분할
Python에서는 Pandas 데이터 프레임을 열 값에 따라 여러 데이터 프레임으로 분할할 수 있습니다. 특정 열의 값. 이 기술은 일반적으로 열 내의 각 고유 범주 또는 그룹에 대해 별도의 데이터 프레임을 생성하는 데 사용됩니다.
예를 들어 "ZZ"라는 열이 있는 다음 데이터 프레임을 고려해 보세요.
df = N0_YLDF ZZ MAT 0 6.286333 2 11.669069 1 6.317000 6 11.669069 2 6.324889 6 11.516454 3 6.320667 5 11.516454 4 6.325556 5 11.516454 5 6.359000 6 11.516454 6 6.359000 6 11.516454 7 6.361111 7 11.516454 8 6.360778 7 11.516454 9 6.361111 6 11.516454
목표는 이 데이터프레임을 4개의 새로운 데이터프레임으로 분할하는 것입니다. 각 데이터프레임에는 "ZZ"가 특정 값(2, 5, 6, 7)을 갖는 행이 포함되어 있습니다. 이를 달성하려면, Pandas의 "groupby" 기능을 활용할 수 있습니다.
gb = df.groupby('ZZ') [gb.get_group(x) for x in gb.groups]
"groupby" 함수는 지정된 열(이 경우 "ZZ")의 값을 기반으로 데이터 프레임 행을 그룹화하는 GroupBy 개체를 생성합니다. . "ZZ"의 각 고유 값은 GroupBy 개체 내의 그룹이 됩니다.
다음 줄에서는 목록 이해를 사용하여 그룹을 반복하고 각 그룹을 별도의 데이터 프레임으로 검색합니다. 해당 데이터프레임을 추출하기 위해 각 그룹의 이름(즉, "ZZ"의 고유 값)과 함께 "get_group" 메소드가 호출됩니다.
결과적으로 이 코드는 4개의 새로운 데이터프레임을 생성하며, 각각은 "ZZ" 열에서 동일한 값을 공유하는 원래 데이터프레임 행.
위 내용은 Groupby를 사용하여 열 값을 기반으로 Pandas DataFrame을 여러 DataFrame으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!