> 백엔드 개발 > 파이썬 튜토리얼 > 구분 기호를 사용하여 Pandas에서 그룹화된 값을 효율적으로 결합하는 방법은 무엇입니까?

구분 기호를 사용하여 Pandas에서 그룹화된 값을 효율적으로 결합하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-12-16 19:55:18
원래의
346명이 탐색했습니다.

How to Efficiently Join Grouped Values in Pandas with a Delimiter?

Pandas에서 구분 기호로 그룹화된 값 결합

groupby 함수를 사용하여 여러 값으로 데이터를 그룹화할 때 문제가 발생하는 것이 일반적입니다. 구분 기호 없이 이러한 값을 연결합니다. 이 문제를 해결하려면 agg 메서드를 활용할 수 있습니다.

다음 DataFrame을 고려하세요.

col | val
-----|-----
A    | Cat
A    | Tiger
B    | Ball
B    | Bat
로그인 후 복사

col 열을 기준으로 이러한 행을 그룹화하고 val 열의 값을 연결하려면 다음을 사용하세요. 다음 코드는 다음과 같습니다.

import pandas as pd
df = pd.DataFrame({'col': ['A', 'A', 'B', 'B'], 'val': ['Cat', 'Tiger', 'Ball', 'Bat']})
grouped = df.groupby('col')['val'].agg('-'.join)
로그인 후 복사

이 접근 방식을 사용하면 원하는 결과를 얻을 수 있습니다. 결과:

col | val
-----|-----
A    | Cat-Tiger
B    | Ball-Bat
로그인 후 복사

그러나 적용 방법을 대안으로 사용하면 아래와 같이 하이픈으로 연결된 값이 여러 번 발생하여 예상치 못한 결과가 발생할 수 있습니다.

df.groupby('col')['val'].apply(lambda x: '-'.join(x))

col | val
-----|-----
A        | C-a-t-T-i-g-e-r
B          | B-a-l-l-B-a-t
로그인 후 복사

이 문제를 방지하려면 위의 예와 같이 agg 메서드를 대신 사용하세요.

또한 그룹화된 인덱스 또는 MultiIndex를 일반 인덱스로 변환하려면 열에서는 Reset_index 메소드를 사용할 수 있습니다:

df1 = grouped.reset_index(name='new')
로그인 후 복사

위 내용은 구분 기호를 사용하여 Pandas에서 그룹화된 값을 효율적으로 결합하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿