Pandas에서 두 개 이상의 데이터 프레임으로 작업할 때 데카르트 곱을 가져와야 할 수 있으며, 이로 인해 다음과 같은 새로운 데이터 프레임이 생성됩니다. 입력 데이터프레임의 모든 행 조합.
최신 버전의 Pandas에서는 병합 기능을 활용하여 How='cross' 인수를 사용하여 이 작업을 수행할 수 있습니다. 이 접근 방식은 간결하면서도 효율적입니다.
import pandas as pd df1 = pd.DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = pd.DataFrame({'col3':[5,6]}) df_cartesian = df1.merge(df2, how='cross')
Pandas 이전 버전의 경우 약간 다른 기술이 필요합니다. 여기에는 두 데이터프레임의 각 행에 대해 반복되는 키 열을 만드는 작업이 포함됩니다. 이 키 열이 추가되면 병합을 사용하여 데카르트 곱을 수행할 수 있습니다.
import pandas as pd from pandas import merge df1 = pd.DataFrame({'key':[1,1], 'col1':[1,2],'col2':[3,4]}) df2 = pd.DataFrame({'key':[1,1], 'col3':[5,6]}) merge(df1, df2,on='key')[['col1', 'col2', 'col3']]
이 접근 방식은 더 복잡하지만 이전 버전의 Pandas에서 효과적으로 작동합니다.
위 내용은 Pandas에서 DataFrame의 데카르트 곱을 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!