여러 데이터 프레임의 데이터를 결합하는 것은 데이터 분석에서 일반적인 작업입니다. . Pandas는 이를 달성하기 위해 Join() 및 merge() 함수를 포함하여 여러 가지 방법을 제공합니다. 이 기사에서는 이러한 함수를 사용하여 공통 열을 공유하는 두 개의 데이터 프레임을 결합하는 방법을 보여줍니다.
join() 함수는 기본적으로 내부 조인을 수행합니다. 조인 열에 일치하는 값이 있는 행만 유지됩니다. 제공된 예에서는 오류 메시지에 표시된 대로 Restaurant_ids_dataframe과 Restaurant_review_frame에 겹치는 열 이름(별표 및 유형)이 있으므로 Join() 함수를 사용할 수 없습니다.
Exception: columns overlap: Index([business_id, stars, type], dtype=object)
merge() 함수는 데이터 프레임 결합에 더 큰 유연성을 제공합니다. 두 데이터 프레임의 모든 행을 유지하는 외부 조인을 수행하려면 How='outer' 매개변수를 사용하세요.
<code class="python">import pandas as pd pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')</code>
기본적으로 merge()는 접미사('_x', '_y')를 사용합니다. ) 이름이 중복된 열을 구별합니다. 접미사를 사용자 정의하려면 아래와 같이 suffixes 매개 변수에 값을 전달하세요.
<code class="python">pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))</code>
join() 및 merge() 함수 모두 데이터 프레임을 결합하는 데 사용할 수 있습니다. 공통 열에. 원하는 조인 동작을 달성하려면 이러한 기능 간의 차이점을 이해하는 것이 중요합니다. merge() 함수는 외부 조인을 수행하고 열 접미사를 사용자 정의하는 기능을 포함하여 더 많은 유연성을 제공합니다. 이러한 기술을 익히면 데이터 프레임을 효과적으로 결합하여 데이터 세트에서 의미 있는 통찰력을 추출할 수 있습니다.
위 내용은 공유 열을 기반으로 Pandas DataFrame을 결합하는 방법: 'join()' 및 'merge()' 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!