다음은 Pandas 다단계 그룹화로 정렬을 구현하는 방법을 공유하는 방법입니다. 이는 좋은 참고 가치가 있으며 모든 사람에게 도움이 되기를 바랍니다. 함께 살펴볼까요
pandas에는 그룹별 그룹화 기능과 sort_values 정렬 기능이 있는데 그룹화한 후 데이터프레임을 어떻게 정렬하나요?
In [70]: df = pd.DataFrame(((random.randint(2012, 2016), random.choice(['tech', 'art', 'office']), '%dk-%dk'%(random.randint(2,10), random.randint(10, 20)), '') for _ in xrange(10000)), columns=['publish_time', 'classf', 'salary', 'title']) In [71]: df.head() Out[71]: publish_time classf salary title 0 2012 art 2k-19k 1 2014 office 5k-17k 2 2013 office 2k-10k 3 2013 art 5k-14k 4 2013 art 2k-14k In [72]: df.groupby(['publish_time', 'classf', 'salary']).count()['title'].groupby(level=0, group_keys=False).nlargest(10) Out[72]: publish_time classf salary 2012 art 7k-13k 18 4k-13k 16 tech 3k-12k 14 art 6k-16k 13 8k-15k 13 office 5k-18k 13 tech 4k-14k 13
관련 권장 사항:
pandas는 중복 테이블의 중복 제거를 구현하고 이를 테이블로 다시 변환
위 내용은 정렬을 달성하기 위한 Pandas 다중 레벨 그룹화 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!