Python ist eine vielseitige Programmiersprache auf hohem Niveau, die in den letzten Jahren immer beliebter geworden ist, unter anderem aufgrund ihrer Fähigkeit, große Datenmengen problemlos zu verarbeiten. Die Pandas-Bibliothek ist eines der leistungsstärksten Tools für die Arbeit mit Daten im Python-Ökosystem und bietet benutzerfreundliche Datenstrukturen wie DataFrame und Series.
In diesem Tutorial konzentrieren wir uns auf eine häufige Aufgabe in der Datenanalyse: das Konvertieren einer Liste in DataFrame-Zeilen in Python mithilfe von Pandas. Dies ist eine wesentliche Fähigkeit für jeden, der mit Daten in Python arbeitet, da Sie damit schnell und einfach neue Datenzeilen zu einem DataFrame hinzufügen können. Im weiteren Verlauf dieses Artikels führen wir Sie Schritt für Schritt durch den Prozess der Konvertierung einer Liste in DataFrame-Zeilen.
Um die Liste in DataFrame-Zeilen zu konvertieren, verwenden wir die Pandas-Bibliothek. Stellen Sie zunächst sicher, dass Pandas auf unserem System installiert ist.
Um Pandas zu installieren, können Sie den Python-Paketmanager pip verwenden, auf den Sie über die Eingabeaufforderung oder das Terminal zugreifen können. Geben Sie dazu einfach den unten angegebenen Befehl ein.
pip install pandas
Mit dem obigen Befehl wird die neueste Version von Pandas heruntergeladen und auf Ihrem System installiert. Nach der Installation können wir damit die Liste in DataFrame-Zeilen konvertieren.
Um eine Liste in DataFrame-Zeilen umzuwandeln, müssen wir zunächst eine Liste mit den Daten erstellen, die wir hinzufügen möchten. Diese Liste sollte die gleiche Anzahl an Elementen enthalten wie die Anzahl der Spalten im DataFrame. Angenommen, wir haben einen DataFrame mit drei Spalten – „Name“, „Alter“ und „Stadt“.
Berücksichtigen Sie den folgenden Codeausschnitt, um eine Datenliste mit neuen Zeilen zu erstellen:
new_row_data = ['Prince', 26, 'New Delhi]
Der nächste wichtige Schritt in unserem Prozess besteht darin, ein brandneues DataFrame-Objekt zu generieren, das die Spaltennamen des vorhandenen DataFrame kopiert. Es ist wichtig sicherzustellen, dass die Spaltennamen übereinstimmen, um neue Zeilen mithilfe von Pandas effizient an einen DataFrame anhängen zu können.
Um dies zu erreichen, können wir einen leeren DataFrame mit genau denselben Spaltennamen wie der ursprüngliche DataFrame erstellen.
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
Da wir nun einen neuen leeren DataFrame mit den entsprechenden Spaltennamen erstellt haben, ist es an der Zeit, einige Daten hinzuzufügen. Wir können dies tun, indem wir die „append“-Methode des DataFrame-Objekts verwenden, die es uns ermöglicht, neue Datenzeilen an einen vorhandenen DataFrame anzuhängen. Dazu müssen wir das Pandas-Serienobjekt an die „append“-Methode übergeben, die die neue Datenzeile darstellt.
Um zu vermeiden, dass vorhandene Zeilen im DataFrame überschrieben werden, müssen wir beim Anhängen neuer Zeilen den Parameter „ignore_index=True“ übergeben. Dadurch wird sichergestellt, dass neue Zeilen als völlig neue Zeilen mit eindeutigen Indexnummern angehängt werden.
Betrachten Sie den folgenden Code, der mithilfe der Append-Methode neue Zeilen an unseren Datenrahmen anhängt.
import pandas as pd # create a list of data for the new row new_row_data = ['Prince', 26, 'New Delhi'] # create a new empty DataFrame with the correct column names df = pd.DataFrame(columns=['Name', 'Age', 'City']) # append the new row to the DataFrame df = df.append(pd.Series(new_row_data, index=df.columns), ignore_index=True) # print the updated DataFrame print(df)
Im obigen Code importieren wir zunächst die Pandas-Bibliothek. Als nächstes erstellen wir eine Liste namens „new_row_data“, die die Werte enthält, die wir als neue Zeilen zum DataFrame hinzufügen möchten. Anschließend erstellen wir ein neues leeres DataFrame-Objekt mit dem Namen „df“ mit denselben Spaltennamen wie der vorhandene DataFrame.
Als nächstes hängen wir neue Zeilen an den DataFrame an, indem wir die „append“-Methode des DataFrame-Objekts verwenden. Wir übergeben das Pandas-Serienobjekt an die Methode „append“, die unsere neue Datenzeile darstellt. Wir verwenden den Parameter „ignore_index=True“, um sicherzustellen, dass neue Zeilen als neue Zeilen mit neuen Indexnummern angehängt werden, anstatt vorhandene Zeilen zu überschreiben.
Abschließend drucken wir den aktualisierten DataFrame aus, um zu bestätigen, dass unsere neuen Zeilen erfolgreich hinzugefügt wurden.
Name Age City 0 Prince 26 New Delhi
Wie Sie in der obigen Ausgabe sehen können, besteht der strukturierte Datensatz in Form von DataFrame aus einer einzelnen Zeile und drei Spalten, wobei jede Spalte eine eigene Beschriftung hat. Die Spaltenbezeichnungen lauten Name, Alter und Stadt.
In diesem Tutorial haben wir gelernt, wie man mithilfe der Pandas-Bibliothek eine Liste in DataFrame-Zeilen in Python konvertiert. Wir stellen zunächst sicher, dass Pandas auf unserem System installiert ist, und erstellen dann eine Liste mit den Daten, die wir als neue Zeilen zum DataFrame hinzufügen möchten. Anschließend erstellen wir ein neues leeres DataFrame-Objekt mit denselben Spaltennamen wie der vorhandene DataFrame und hängen die neuen Datenzeilen mithilfe der Methode „append“ an. Wir verwenden den Parameter „ignore_index=True“, um sicherzustellen, dass neue Zeilen als neue Zeilen mit neuen Indexnummern angehängt werden, anstatt vorhandene Zeilen zu überschreiben. Wir stellen für jede in diesem Prozess verwendete Methode ein Beispiel bereit.
Das obige ist der detaillierte Inhalt vonWie konvertiere ich eine Liste in DataFrame-Zeilen in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!