Pandas Groupby를 사용하여 여러 행의 문자열 연결
Pandas를 사용한 데이터 조작 영역에서는 여러 행의 문자열을 결합해야 하는 경우가 많습니다. 특정 기준에 따른 행. Groupby 작업은 이를 달성하는 강력한 방법을 제공합니다. 실제적인 예를 살펴보겠습니다.
"name", "text" 및 "date" 열이 있는 DataFrame이 있다고 가정합니다. 우리는 "이름"과 "월"의 고유한 각 조합에 대해 "텍스트" 항목을 연결하려고 합니다. 이를 달성하려면 다음 단계를 활용할 수 있습니다.
GroupBy 및 변환: DataFrame을 "이름" 및 "월" 열을 기준으로 그룹화합니다. 그런 다음 변환 작업을 적용하고 람다 함수를 사용하여 "텍스트" 항목을 쉼표 구분 기호로 결합합니다.
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
중복 항목 제거: 변환된 ' 텍스트' 열에 중복된 항목이 있을 수 있습니다. 고유 항목을 유지하려면 "이름" 및 "월" 열을 기준으로 중복 항목을 삭제하세요.
df[['name','text','month']].drop_duplicates()
또는 Apply 및 Reset_index를 사용하여 원하는 항목을 얻음으로써 프로세스를 단순화할 수 있습니다. 출력:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
이러한 메서드를 사용하면 Pandas DataFrame의 여러 행에서 문자열을 효율적으로 연결하여 데이터를 조작할 수 있습니다. 작업을 더 쉽게 관리할 수 있습니다.
위 내용은 Groupby를 사용하여 여러 Pandas DataFrame 행의 문자열을 어떻게 연결할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!