> 백엔드 개발 > 파이썬 튜토리얼 > Pandas에서 ID 및 그룹별로 용어 발생을 효율적으로 계산하는 방법은 무엇입니까?

Pandas에서 ID 및 그룹별로 용어 발생을 효율적으로 계산하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-12-25 19:27:14
원래의
938명이 탐색했습니다.

How to Efficiently Count Term Occurrences by ID and Group in Pandas?

Pandas' Groupby를 사용하여 ID 및 그룹별 용어 수 검색

문제

ID(id), 그룹(group)에 대한 열이 포함된 DataFrame이 제공됩니다. ) 및 용어(term)를 사용하여 ID와 용어의 각 고유 조합에 대해 각 용어의 발생을 효율적으로 계산하는 것이 목표입니다. group.

솔루션

Pandas의 강력한 groupby 및 size 기능을 활용하면 루프에 의존하지 않고도 이를 달성할 수 있습니다.

df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
로그인 후 복사

결과

이것은 작업은 용어를 나타내는 계층적 MultiIndex DataFrame을 생성합니다. 개수:

</p>
<div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">         term
로그인 후 복사

그룹 용어1 용어2 용어3
ID
1 3 2 0
2 2 1 1

공연 분석

수백만 개의 행이 포함된 대규모 데이터 세트의 경우에도 이 벡터화된 접근 방식은 탁월한 성능을 보여줍니다.

1,000,000 rows
----------------
Elapsed time: 1.2 seconds
로그인 후 복사

위 내용은 Pandas에서 ID 및 그룹별로 용어 발생을 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 추천
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿