제공된 DataFrame에는 A, B, C라는 세 개의 열이 포함되어 있습니다. 목표는 DataFrame을 다음과 같이 그룹화하는 것입니다. A열을 사용하고 각 그룹에 대해 C열에서 문자열 합집합을 얻습니다.
기본적으로 groupby는 숫자 열의 합계를 구하지만 문자열에는 작동하지 않습니다.
한 가지 접근 방식은 조인 메서드를 사용하여 각 그룹 내에서 문자열을 연결하는 함수를 정의하는 것입니다.
<code class="python">def f(x): return "{%s}" % ', '.join(x)</code>
이 함수를 그룹화된 DataFrame에 적용합니다.
<code class="python">result = df.groupby('A')['C'].apply(f)</code>
이 접근 방식은 원하는 출력을 생성합니다.
A 1 {This, string} 2 {is, !} 3 {a} 4 {random}
또 다른 옵션은 데이터 유형을 수정하여 합이 문자열을 연결하도록 하는 것입니다.
<code class="python">df['C'] = df['C'].astype(str) result = df.groupby('A')['C'].sum()</code>
이 역시 원하는 결과를 제공합니다.
위 내용은 Pandas groupby를 사용하여 그룹 내에서 문자열을 결합하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!