np.array_split을 사용하여 대형 Pandas DataFrame을 여러 그룹으로 분할하는 방법
대량 데이터 프레임을 처리할 때 분할이 필요할 수 있습니다. 더 작고 관리하기 쉬운 덩어리로 나눕니다. 이를 통해 보다 효율적인 처리 및 분석이 가능해집니다. 데이터프레임을 분할하는 한 가지 방법은 np.split() 함수를 사용하는 것입니다. 그러나 이 함수는 데이터프레임이 원하는 분할 수로 균등하게 나누어지지 않을 때 문제가 발생할 수 있습니다.
이 상황에 더 적합한 대안은 np.array_split() 함수를 사용하는 것입니다. 이 함수를 사용하면 indices_or_sections 매개변수가 축을 균등하게 나누지 않는 정수가 될 수 있습니다.
<code class="python">import pandas as pd import numpy as np # Create a large dataframe df = pd.DataFrame(...) # Define the number of groups to split the dataframe into n_groups = 4 # Split the dataframe using np.array_split() dataframe_chunks = np.array_split(df, n_groups) # Iterate over the dataframe chunks and print their contents for item in dataframe_chunks: print(item)</code>
추가 참고 사항:
위 내용은 np.array_split을 사용하여 대형 Pandas DataFrame을 고르지 않은 분할로 여러 그룹으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!