如何使用 np.array_split 将大型 Pandas DataFrame 拆分为多个组
处理大量数据帧时,可能需要拆分将它们分成更小、更易于管理的块。这可以实现更高效的处理和分析。分割数据帧的一种方法是使用 np.split() 函数。但是,当数据帧不能被所需的分割数整除时,此函数可能会遇到问题。
这种情况更合适的替代方案是使用 np.array_split() 函数。此函数允许indexes_or_sections参数为不等分轴的整数。
<code class="python">import pandas as pd import numpy as np # Create a large dataframe df = pd.DataFrame(...) # Define the number of groups to split the dataframe into n_groups = 4 # Split the dataframe using np.array_split() dataframe_chunks = np.array_split(df, n_groups) # Iterate over the dataframe chunks and print their contents for item in dataframe_chunks: print(item)</code>
附加说明:
以上是如何使用 np.array_split 将大型 Pandas DataFrame 拆分为多个不均匀划分的组?的详细内容。更多信息请关注PHP中文网其他相关文章!