以下にいくつかのタイトルオプションを示します。それぞれがソリューションのさまざまな側面を強調しています。問題に焦点を当てる: * メモリエラーを発生させずに大規模な Pandas データフレームを処理するにはどうすればよいですか? * Pandas のメモリエラー:-Python チュートリアル-php.cn

以下にいくつかのタイトルオプションを示します。それぞれがソリューションのさまざまな側面を強調しています。問題に焦点を当てる: * メモリエラーを発生させずに大規模な Pandas データフレームを処理するにはどうすればよいですか? * Pandas のメモリエラー:

Patricia Arquette

リリース： 2024-10-27 06:19:29

オリジナル

974 人が閲覧しました

Here are a few title options, each highlighting a different aspect of the solution:

Focusing on the Problem:

* How to Process Large Pandas DataFrames Without Memory Errors?
* Memory Error in Pandas: Efficiently Handling Large Dataframes?

Focusing on t

大きな Pandas データフレームのスライス

問題:

大きなデータフレームを関数の結果はメモリエラーとなり、データフレームサイズが過剰であることを示唆しています。目標は次のとおりです。

データフレームを小さなセグメントにチャンクします。
関数内で小さなチャンクを反復処理します。
処理されたセグメントを 1 つのデータフレームに統合します。

解決策:

行数によるスライス

固定行数による分割はリストを使用して実行できます。 numpy からの内包表記または array_split:

<code class="python">n = 200000  # Chunk row size
list_df = [df[i:i + n] for i in range(0, df.shape[0], n)]</code>

ログイン後にコピー

<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>

ログイン後にコピー

Slicing by AcctName

AcctName などの特定の列値でスライスするには:

<code class="python">list_df = []

for n, g in df.groupby('AcctName'):
    list_df.append(g)</code>

ログイン後にコピー

統合

大きなデータフレームがスライスされると、pd.concat:

<code class="python">consolidated_df = pd.concat(list_df)</code>

ログイン後にコピー

を使用して再構築できます。

以上が以下にいくつかのタイトルオプションを示します。それぞれがソリューションのさまざまな側面を強調しています。問題に焦点を当てる: * メモリエラーを発生させずに大規模な Pandas データフレームを処理するにはどうすればよいですか? * Pandas のメモリエラー:の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。