Ajouter des lignes une par une à une trame de données Pandas
Créer une trame de données vide et ajouter ensuite des lignes une par une est une tâche fondamentale pour manipulation de données dans Pandas.
Approche initiale : champ incrémentiel Mises à jour
Une méthode pour ajouter une seule ligne consiste à utiliser des mises à jour incrémentielles. Par exemple, si nous avons un dataframe vide avec les colonnes « lib », « qty1 » et « qty2 », nous pouvons ajouter une ligne en définissant individuellement les valeurs de chaque colonne :
df = pd.DataFrame(columns=('lib', 'qty1', 'qty2')) df = df._set_value(index=len(df), col='qty1', value=10.0)
Alors que cette approche permet des mises à jour sélectives des champs, cela devient fastidieux pour les insertions groupées.
Approche optimisée : basée sur les lignes Ajout
Une méthode plus efficace et plus complète pour ajouter des lignes consiste à effectuer une affectation basée sur les lignes. Cela implique d'utiliser df.loc[i] pour spécifier un index de ligne spécifique. Voici comment l'implémenter :
import pandas as pd from numpy.random import randint df = pd.DataFrame(columns=['lib', 'qty1', 'qty2']) for i in range(5): df.loc[i] = ['name' + str(i)] + list(randint(10, size=2)) df
Dans cet exemple, la syntaxe df.loc[i] attribue une ligne à l'index i avec une liste comprenant une chaîne et deux entiers aléatoires.
Cette approche fournit un moyen concis et efficace d'ajouter plusieurs lignes à une trame de données, réduisant ainsi considérablement la complexité du code et améliorant l'efficacité.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!