問題:
問題:將資料幀分成更小的段。
迭代函數內的較小的區塊。將處理後的段合併到單一資料幀中。
解:<code class="python">n = 200000 # Chunk row size list_df = [df[i:i + n] for i in range(0, df.shape[0], n)]</code>
<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>
以行數切片
可以使用list 來完成固定行數的分割來自numpy 的理解或array_split:
<code class="python">list_df = [] for n, g in df.groupby('AcctName'): list_df.append(g)</code>
按AcctName 切片
以特定列值切片,例如AcctName:<code class="python">consolidated_df = pd.concat(list_df)</code>
以上是以下是一些標題選項,每個標題選項都強調解決方案的不同方面: 聚焦問題: * 如何在沒有記憶體錯誤的情況下處理大型 Pandas DataFrame? * Pandas 中的記憶體錯誤:的詳細內容。更多資訊請關注PHP中文網其他相關文章!