백엔드 개발 파이썬 튜토리얼 그룹화 후 Pandas DataFrame 열에서 가장 일반적인 값을 찾는 방법은 무엇입니까?

그룹화 후 Pandas DataFrame 열에서 가장 일반적인 값을 찾는 방법은 무엇입니까?

Nov 30, 2024 pm 12:13 PM

How to Find the Most Common Value in a Pandas DataFrame Column After Grouping?

<h2>GroupBy pandas DataFrame 및 가장 일반적인 값 선택</h2>

당신은 3개의 문자열 열이 있는 데이터 프레임을 정리하여 다음을 보장해야 합니다. 세 번째 열에는 처음 두 열의 지정된 조합에 대한 올바른 값이 포함되어 있습니다. 제공한 코드 조각은 처음 두 열을 기준으로 데이터 프레임을 그룹화하고 각 조합에 대해 세 번째 열의 가장 일반적인 값을 선택하려고 시도합니다. 그러나 agg 함수를 실행하려고 할 때 문제가 발생합니다.

<h3>Pandas 사용하기 >= 0.16</h3>

코드에 사용한 구문이 오래되었습니다. . 대신 Pandas 버전 0.16 이상에서 사용할 수 있는 pd.Series.mode 함수를 활용하세요. 이 함수는 일련의 문자열에서 가장 일반적인 값을 반환합니다. 적용 방법은 다음과 같습니다.

1

source.groupby(['Country','City'])['Short name'].agg(pd.Series.mode)

로그인 후 복사

이 구문은 데이터 프레임을 '국가' 및 '도시'별로 그룹화하고, pd.Series.mode 함수를 각 그룹의 '짧은 이름' 열에 적용하고, 결과.

DataFrame으로 출력이 필요한 경우 다음을 사용하세요. line:

1

source.groupby(['Country','City'])['Short name'].agg(pd.Series.mode).to_frame()

로그인 후 복사

<h3>여러 모드 처리</h3>

pd.Series.mode 함수는 여러 모드가 존재하는 상황도 효과적으로 처리합니다. 예를 들어, 가장 일반적인 값과 동일한 빈도로 여러 값이 발생하는 경우 모드 목록으로 반환됩니다.

<h3>대안(권장하지 않음)>

Python 표준 라이브러리의 Statistics.mode 함수를 사용할 수 있습니다. 그러나 이 접근 방식은 여러 모드를 처리할 때 제대로 작동하지 않습니다. 가장 일반적인 값이 하나도 없으면 StatisticsError가 발생합니다.

위 내용은 그룹화 후 Pandas DataFrame 열에서 가장 일반적인 값을 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

뜨거운 기사 태그

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Python을 사용하여 텍스트 파일의 ZIPF 배포를 찾는 방법 Python을 사용하여 텍스트 파일의 ZIPF 배포를 찾는 방법 Mar 05, 2025 am 09:58 AM

Python을 사용하여 텍스트 파일의 ZIPF 배포를 찾는 방법

파이썬에서 파일을 다운로드하는 방법 파이썬에서 파일을 다운로드하는 방법 Mar 01, 2025 am 10:03 AM

파이썬에서 파일을 다운로드하는 방법

HTML을 구문 분석하기 위해 아름다운 수프를 어떻게 사용합니까? HTML을 구문 분석하기 위해 아름다운 수프를 어떻게 사용합니까? Mar 10, 2025 pm 06:54 PM

HTML을 구문 분석하기 위해 아름다운 수프를 어떻게 사용합니까?

파이썬의 이미지 필터링 파이썬의 이미지 필터링 Mar 03, 2025 am 09:44 AM

파이썬의 이미지 필터링

Python을 사용하여 PDF 문서를 사용하는 방법 Python을 사용하여 PDF 문서를 사용하는 방법 Mar 02, 2025 am 09:54 AM

Python을 사용하여 PDF 문서를 사용하는 방법

Django 응용 프로그램에서 Redis를 사용하여 캐시하는 방법 Django 응용 프로그램에서 Redis를 사용하여 캐시하는 방법 Mar 02, 2025 am 10:10 AM

Django 응용 프로그램에서 Redis를 사용하여 캐시하는 방법

NLTK (Natural Language Toolkit) 소개 NLTK (Natural Language Toolkit) 소개 Mar 01, 2025 am 10:05 AM

NLTK (Natural Language Toolkit) 소개

Tensorflow 또는 Pytorch로 딥 러닝을 수행하는 방법은 무엇입니까? Tensorflow 또는 Pytorch로 딥 러닝을 수행하는 방법은 무엇입니까? Mar 10, 2025 pm 06:52 PM

Tensorflow 또는 Pytorch로 딥 러닝을 수행하는 방법은 무엇입니까?

See all articles