Itération sur les lignes dans les DataFrames Pandas
Lorsque vous travaillez avec des données dans Pandas, une tâche courante consiste à parcourir les lignes d'un DataFrame. Cela vous permet d'accéder aux éléments de chaque ligne individuellement.
Comment itérer à l'aide d'iterrows()
La méthode préférée pour parcourir les lignes consiste à utiliser DataFrame.iterrows( ) méthode. Cette méthode génère un tuple pour chaque ligne, contenant à la fois l'index et la ligne sous forme de série.
df = pd.DataFrame({'c1': [10, 11, 12], 'c2': [100, 110, 120]}) for index, row in df.iterrows(): print(row['c1'], row['c2'])
Cela affichera :
10 100 11 110 12 120
Comment fonctionne l'objet de ligne
L'objet ligne est une série Pandas qui représente les données de la ligne. Vous pouvez accéder à ses éléments par leurs noms de colonnes ou par leur index.
Alternatives à iterrows()
Il existe des méthodes alternatives que vous pouvez utiliser pour parcourir les lignes, mais ils sont généralement moins efficaces.
Considérations relatives aux performances
Itération sur les lignes dans un DataFrame peut être coûteux en termes de calcul. Si les performances sont un problème, envisagez d'utiliser des solutions vectorisées ou d'écrire des boucles internes avec Cython ou NumPy.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!