Comment traiter efficacement des DataFrames volumineux dans Pandas : fragmentez-les !

Susan Sarandon
Libérer: 2024-10-27 07:57:03
original
497 Les gens l'ont consulté

How to Efficiently Process Large DataFrames in Pandas: Chunk It Up!

Pandas - Découper de grandes trames de données en morceaux

Lorsque vous essayez de traiter des trames de données surdimensionnées, un obstacle courant est la redoutable erreur de mémoire. Une solution efficace consiste à diviser la trame de données en morceaux plus petits et gérables. Cette stratégie réduit non seulement la consommation de mémoire, mais facilite également un traitement efficace.

Pour y parvenir, nous pouvons exploiter soit la compréhension de liste, soit la fonction NumPy array_split.

Compréhension de liste

<code class="python">n = 200000  # Chunk row size
list_df = [df[i:i+n] for i in range(0, df.shape[0], n)]</code>
Copier après la connexion

NumPy array_split

<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>
Copier après la connexion

Des morceaux individuels peuvent ensuite être récupérés en utilisant :

<code class="python">list_df[0]
list_df[1]
...</code>
Copier après la connexion

Pour réassembler les morceaux en une seule trame de données, utilisez pd.concat :

<code class="python"># Example: Concatenating by chunks
rejoined_df = pd.concat(list_df)</code>
Copier après la connexion

Découpage par AcctName

Pour diviser la trame de données par valeurs AcctName, utilisez la méthode groupby :

<code class="python">list_df = []

for n, g in df.groupby('AcctName'):
    list_df.append(g)</code>
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!