구분자 조이너를 사용하는 Pandas GroupBy
Pandas에서 여러 값을 사용하여 데이터를 그룹화할 때 특정 구분 기호. 그러나 간단한 groupby 및 sum 작업으로 인해 원하는 구분 기호 없이 원하지 않는 출력이 발생할 수 있습니다.
다음 코드를 고려하세요.
import pandas as pd df = pd.read_csv("Inputfile.txt", sep='\t') group = df.groupby(['col'])['val'].sum() # Output: # A CatTiger # B BallBat
이렇게 하면 연결된 값이 포함된 단일 문자열이 생성됩니다. 원하는 하이픈 구분 기호.
원하는 출력을 얻으려면 다음과 함께 적용 기능을 활용할 수 있습니다. Join:
group = df.groupby(['col'])['val'].sum().apply(lambda x: '-'.join(x))
그러나 이 솔루션은 각 값에 원치 않는 문자가 포함되어 있기 때문에 여전히 예상한 결과를 산출하지 못할 수 있습니다.
대체 솔루션
대신, 조인 매개변수와 함께 agg 함수를 사용하는 것을 고려해 보세요.
df.groupby('col')['val'].agg('-'.join)
이렇게 하면 올바르게 됩니다. 하이픈 구분 기호를 사용하여 그룹 내의 값을 연결하여 원하는 출력을 제공합니다.
col A Cat-Tiger B Ball-Bat Name: val, dtype: object
솔루션 업데이트
MultiIndex 또는 Index 열을 처리하려면 인덱스를 재설정할 수 있습니다. 그리고 Reset_index 함수를 사용하여 이름을 바꾸세요.
df1 = df.groupby('col')['val'].agg('-'.join).reset_index(name='new')
이렇게 하면 인덱스가 새 열로 변환됩니다. 'new'라는 이름으로 그룹화된 데이터를 더욱 편리하게 작업할 수 있습니다.
위 내용은 구분 기호를 사용하여 Pandas GroupBy 그룹 내에서 값을 효율적으로 연결하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!