Effizientes Anhängen mehrerer Zeilen an einen Pandas-DataFrame
Bei der Arbeit mit Daten kommt es häufig vor, dass Sie inkrementell Zeilen anhängen müssen ein vorhandener DataFrame. Während der Ansatz, Werte jeweils feldweise mit df._set_value() festzulegen, realisierbar ist, kann er beim Hinzufügen mehrerer Zeilen ineffizient sein.
Verwendung von df.loc[i] für effiziente Zeilenaddition
Eine bessere und übersichtlichere Möglichkeit, mehrere Zeilen hinzuzufügen, ist die Verwendung von df.loc[i]. So funktioniert es:
Importieren Sie die erforderlichen Bibliotheken:
import pandas as pd from numpy.random import randint
Erstellen Sie einen leeren DataFrame mit Ihren gewünschten Spalten:
df = pd.DataFrame(columns=['lib', 'qty1', 'qty2'])
Iterieren Sie über die gewünschte Anzahl von Zeilen add:
for i in range(5):
Verwenden Sie innerhalb der Schleife df.loc[i], um auf die Zeile mit dem Index i zuzugreifen und die gewünschten Werte für die Spalten lib, qty1 und qty2 zuzuweisen. Zum Beispiel:
df.loc[i] = ['name' + str(i)] + list(randint(10, size=2))
Beispiel:
Hier ist ein vollständiges Beispiel, das zeigt, wie man df.loc[i] verwendet, um fünf Zeilen anzuhängen zu unserem DataFrame:
import pandas as pd from numpy.random import randint df = pd.DataFrame(columns=['lib', 'qty1', 'qty2']) for i in range(5): df.loc[i] = ['name' + str(i)] + list(randint(10, size=2)) print(df)
Ausgabe:
lib qty1 qty2 0 name0 3 3 1 name1 2 4 2 name2 2 8 3 name3 2 1 4 name4 9 6
Die Verwendung von df.loc[i] bietet eine bequeme und effiziente Möglichkeit, mehrere Zeilen gleichzeitig zu einem DataFrame hinzuzufügen , ohne dass mehrere Aufrufe von df._set_value() erforderlich sind.
Das obige ist der detaillierte Inhalt vonWie kann ich mehrere Zeilen effizient an einen Pandas-DataFrame anhängen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!