ホームページ > バックエンド開発 > Python チュートリアル > 以下にいくつかのタイトル オプションを示します。それぞれがソリューションのさまざまな側面を強調しています。 問題に焦点を当てる: * メモリ エラーを発生させずに大規模な Pandas データフレームを処理するにはどうすればよいですか? * Pandas のメモリ エラー:

以下にいくつかのタイトル オプションを示します。それぞれがソリューションのさまざまな側面を強調しています。 問題に焦点を当てる: * メモリ エラーを発生させずに大規模な Pandas データフレームを処理するにはどうすればよいですか? * Pandas のメモリ エラー:

Patricia Arquette
リリース: 2024-10-27 06:19:29
オリジナル
936 人が閲覧しました

Here are a few title options, each highlighting a different aspect of the solution:

Focusing on the Problem:

* How to Process Large Pandas DataFrames Without Memory Errors?
* Memory Error in Pandas:  Efficiently Handling Large Dataframes?

Focusing on t

大きな Pandas データフレームのスライス

問題:

大きなデータフレームを関数の結果はメモリ エラーとなり、データフレーム サイズが過剰であることを示唆しています。目標は次のとおりです。

  1. データフレームを小さなセグメントにチャンクします。
  2. 関数内で小さなチャンクを反復処理します。
  3. 処理されたセグメントを 1 つのデータフレームに統合します。

解決策:

行数によるスライス

固定行数による分割はリストを使用して実行できます。 numpy からの内包表記または array_split:

<code class="python">n = 200000  # Chunk row size
list_df = [df[i:i + n] for i in range(0, df.shape[0], n)]</code>
ログイン後にコピー
<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>
ログイン後にコピー

Slicing by AcctName

AcctName などの特定の列値でスライスするには:

<code class="python">list_df = []

for n, g in df.groupby('AcctName'):
    list_df.append(g)</code>
ログイン後にコピー

統合

大きなデータフレームがスライスされると、pd.concat:

<code class="python">consolidated_df = pd.concat(list_df)</code>
ログイン後にコピー
を使用して再構築できます。

以上が以下にいくつかのタイトル オプションを示します。それぞれがソリューションのさまざまな側面を強調しています。 問題に焦点を当てる: * メモリ エラーを発生させずに大規模な Pandas データフレームを処理するにはどうすればよいですか? * Pandas のメモリ エラー:の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート