Comment diviser un grand DataFrame Pandas en plusieurs groupes avec np.array_split
Lorsque vous traitez des dataframes massifs, il peut être nécessaire de diviser divisez-les en morceaux plus petits et plus faciles à gérer. Cela permet un traitement et une analyse plus efficaces. Une méthode pour diviser les trames de données consiste à utiliser la fonction np.split(). Cependant, cette fonction peut rencontrer des problèmes lorsque la trame de données n'est pas divisible de manière égale par le nombre de divisions souhaité.
Une alternative plus appropriée à cette situation consiste à utiliser la fonction np.array_split(). Cette fonction permet au paramètre indices_or_sections d'être un entier qui ne divise pas également l'axe.
<code class="python">import pandas as pd import numpy as np # Create a large dataframe df = pd.DataFrame(...) # Define the number of groups to split the dataframe into n_groups = 4 # Split the dataframe using np.array_split() dataframe_chunks = np.array_split(df, n_groups) # Iterate over the dataframe chunks and print their contents for item in dataframe_chunks: print(item)</code>
Notes supplémentaires :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!