如何使用np.array_split 將大型Pandas DataFrame 拆分為多個群組
處理大量資料幀時,可能需要拆分將資料幀它們分成更小、更易於管理的區塊。這可以實現更有效率的處理和分析。分割資料幀的一種方法是使用 np.split() 函數。但是,當資料幀不能被所需的分割數整除時,此函數可能會遇到問題。
這種情況更合適的替代方案是使用 np.array_split() 函數。此函數允許indexes_or_sections參數為不等分軸的整數。
<code class="python">import pandas as pd import numpy as np # Create a large dataframe df = pd.DataFrame(...) # Define the number of groups to split the dataframe into n_groups = 4 # Split the dataframe using np.array_split() dataframe_chunks = np.array_split(df, n_groups) # Iterate over the dataframe chunks and print their contents for item in dataframe_chunks: print(item)</code>
附加說明:
以上是如何使用 np.array_split 將大型 Pandas DataFrame 拆分為多個不均勻劃分的群組?的詳細內容。更多資訊請關注PHP中文網其他相關文章!