GroupBy를 사용하여 DataFrame을 여러 열로 그룹화할 때 결과는 MultiIndex 시리즈인 경우가 많습니다. 그러나 특정 시나리오에서는 데이터를 다시 DataFrame 형식으로 요구할 수 있습니다. 이 문서에서는 GroupBy의 MultiIndex 시리즈 출력을 다시 DataFrame으로 변환하는 방법을 보여줍니다.
다음 샘플 DataFrame을 고려하세요.
City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory
여러 열과 함께 GroupBy를 사용하면 발생 횟수를 계산할 수 있습니다.
g1 = df1.groupby(["Name", "City"]).count()
그러나 g1의 출력은 MultiIndex입니다. 시리즈:
City Name Name City Alice Seattle 1 1 Bob Seattle 2 2 Mallory Portland 2 2 Seattle 1 1
이를 다시 DataFrame으로 변환하려면 두 가지 접근 방식을 활용할 수 있습니다.
방법 1: 접미사 추가 및 색인 재설정
열 이름에 접미사를 추가하고 재설정합니다. index:
g1.add_suffix('_Count').reset_index()
이렇게 하면 이름, 도시, 개수를 표시하기 위해 접미사가 _Count인 두 개의 추가 열 등 세 개의 열이 있는 DataFrame이 생성됩니다.
방법 2: DataFrame 사용 생성자
또는 다음과 함께 DataFrame 생성자를 사용할 수 있습니다. .size() 메소드를 사용하여 발생 횟수를 계산하고 인덱스를 재설정합니다.
DataFrame({'count' : df1.groupby( [ "Name", "City"] ).size()}).reset_index()
이 접근 방식은 이름, 도시 및 횟수를 나타내는 추가 열 개수라는 두 개의 열이 있는 DataFrame을 생성합니다.
위 내용은 Pandas GroupBy MultiIndex 시리즈를 DataFrame으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!