> 백엔드 개발 > 파이썬 튜토리얼 > Pandas Groupby 결과 내에서 문자열을 효율적으로 결합하는 방법은 무엇입니까?

Pandas Groupby 결과 내에서 문자열을 효율적으로 결합하는 방법은 무엇입니까?

Patricia Arquette
풀어 주다: 2024-12-16 15:22:11
원래의
882명이 탐색했습니다.

How to Efficiently Join Strings Within Pandas Groupby Results?

구분자 조인을 사용한 Pandas groupby

Pandas에서 중복 값이 ​​포함된 데이터를 작업할 때 groupby 기능을 사용하는 것이 유용할 수 있습니다. 그러나 그룹 내 고유한 값을 유지하면서 요약된 값을 얻으려면 사용자 지정 조인 작업을 구현해야 할 수도 있습니다.

다음 예를 고려하세요.

col  val
A    Cat
A    Tiger
B    Ball
B    Bat
로그인 후 복사

사용 시 'col'의 각 고유 값에 대해 'val' 열을 합산하는 groupby 함수를 사용하면 다음 출력이 생성됩니다.

A CatTiger
B BallBat
로그인 후 복사

결합된 값에 구분 기호(예: '-')를 사용하면 다음 코드를 사용할 수 있습니다.

df.groupby(['col'])['val'].sum().apply(lambda x: '-'.join(x))
로그인 후 복사

그러나 이 접근 방식은 예상치 못한 결과를 초래합니다.

A C-a-t-T-i-g-e-r
B B-a-l-l-B-a-t
로그인 후 복사

문제 연결된 문자열 대신 'val' 열의 개별 값이 포함된 Series 개체를 수신하는 람다 함수로 인해 발생합니다.

다음 대체 접근 방식을 사용하여 원하는 구분 기호로 결합된 출력을 얻을 수 있습니다.

df.groupby('col')['val'].agg('-'.join)
로그인 후 복사

이는 출력을 제공합니다.

col
A    Cat-Tiger
B     Ball-Bat
Name: val, dtype: object
로그인 후 복사

인덱스 또는 MultiIndex를 열로 변환하려면 다음을 사용할 수 있습니다. Reset_index 함수:

df1 = df.groupby('col')['val'].agg('-'.join).reset_index(name='new')
로그인 후 복사

위 내용은 Pandas Groupby 결과 내에서 문자열을 효율적으로 결합하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿