Itération sur les lignes dans Pandas DataFrame
Dans Pandas, la méthode iterrows() fournit un moyen pratique de parcourir les lignes d'un DataFrame . Cette méthode génère un tuple pour chaque ligne, où le premier élément est l'index de la ligne et le deuxième élément est une série Pandas contenant les valeurs de la ligne.
Considérez le DataFrame suivant :
c1 c2 0 10 100 1 11 110 2 12 120
Pour parcourir les lignes à l'aide de iterrows(), utilisez la syntaxe suivante :
for index, row in df.iterrows(): print(row['c1'], row['c2'])
Ce code imprime les valeurs du Colonnes 'c1' et 'c2' pour chaque ligne :
10 100 11 110 12 120
Comprendre l'objet Row
L'objet ligne renvoyé par iterrows() est une série Pandas qui représente une seule ligne du DataFrame. Il permet d'accéder aux valeurs de la ligne par nom de colonne, index et étiquette. Par exemple :
print(row) # prints the entire row as a Series print(row['c1']) # prints the value of the 'c1' column print(row.index) # prints the row's index print(row.name) # prints the row's label
Considérations relatives aux performances
L'itération sur les objets pandas peut être lente, en particulier pour les grands ensembles de données. Si les performances sont critiques, envisagez plutôt d’utiliser des opérations vectorisées ou d’appliquer des fonctions au DataFrame. Cependant, iterrows() reste un outil utile pour effectuer des opérations itératives non vectorisables.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!