


Wie kann ich eine durch Kommas getrennte Zelle in einem Pandas DataFrame in mehrere Zeilen aufteilen?
Aufteilen einer Zelle in mehrere Zeilen in einem Pandas-Datenrahmen
Pandas bietet umfassende Tools zur Datenbearbeitung, einschließlich der Möglichkeit, eine Zelle zu teilen, die mehrere durch Kommas getrennte Werte enthält in mehrere Reihen aufteilen. In diesem Leitfaden werden wir Methoden untersuchen, um dies zu erreichen, indem wir zwei verschiedene Ansätze verwenden, die auf der Pandas-Version basieren.
pandas >= 0,25
Für Pandas-Versionen 0,25 und höher können Sie eine Kombination verwenden von apply, str.split und Series.explode, um das gewünschte Ergebnis zu erzielen. Hier ist der Codeausschnitt:
<code class="python">(df.set_index(['order_id', 'order_date']) .apply(lambda x: x.str.split(',').explode()) .reset_index()) </code>
Erklärung:
- set_index(['order_id', 'order_date']): Legt die Spalten order_id und order_date fest als Index, um sie bei nachfolgenden Vorgängen beizubehalten.
- apply(lambda x: x.str.split(',').explode()): Wendet eine Lambda-Funktion auf jede Zeile an. Es teilt die Zellwerte (Paket und Paketcode) anhand des Komma-Trennzeichens auf und explodiert die resultierenden Listen in mehrere Zeilen.
- reset_index(): Setzt den Index zurück, um einen neuen DataFrame mit den explodierten Werten als separate Zeilen zu erstellen.
pandas <= 0.24
Für Pandas-Versionen 0.24 und niedriger ist ein komplexerer Ansatz mit Stack, Unstack und Str.Split erforderlich:
<code class="python">(df.set_index(['order_date', 'order_id']) .stack() .str.split(',', expand=True) .stack() .unstack(-2) .reset_index(-1, drop=True) .reset_index() )</code>
Erklärung:
- Ähnlich wie beim vorherigen Ansatz legt set_index order_date und order_id als Index fest.
- stack() kollabiert die Zeilen und stapelt sie als einzelne Spalte.
- str.split(',', expand=True) teilt die kombinierten Werte basierend auf dem Komma-Trennzeichen in mehrere Spalten auf.
- stack() stapelt die Spalten, um eine einzelne zu erstellen Spalte erneut.
- unstack(-2) entstapelt den DataFrame auf der vorletzten Ebene, um Zeilen zu erstellen, die die geteilten Werte enthalten.
- reset_index(-1, drop=True) entfernt die zusätzliche Ebene des Index.
- reset_index() fügt einen neuen Index hinzu, um einen neuen DataFrame zu erstellen.
Beide Methoden geben einen neuen DataFrame mit den aufgelösten Werten als separate Zeilen zurück, wie in dargestellt die gewünschte Ausgabe, die Sie bereitgestellt haben.
Das obige ist der detaillierte Inhalt vonWie kann ich eine durch Kommas getrennte Zelle in einem Pandas DataFrame in mehrere Zeilen aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen











Python ist leichter zu lernen und zu verwenden, während C leistungsfähiger, aber komplexer ist. 1. Python -Syntax ist prägnant und für Anfänger geeignet. Durch die dynamische Tippen und die automatische Speicherverwaltung können Sie die Verwendung einfach zu verwenden, kann jedoch zur Laufzeitfehler führen. 2.C bietet Steuerung und erweiterte Funktionen auf niedrigem Niveau, geeignet für Hochleistungsanwendungen, hat jedoch einen hohen Lernschwellenwert und erfordert manuellem Speicher und Typensicherheitsmanagement.

Um die Effizienz des Lernens von Python in einer begrenzten Zeit zu maximieren, können Sie Pythons DateTime-, Zeit- und Zeitplanmodule verwenden. 1. Das DateTime -Modul wird verwendet, um die Lernzeit aufzuzeichnen und zu planen. 2. Das Zeitmodul hilft, die Studie zu setzen und Zeit zu ruhen. 3. Das Zeitplanmodul arrangiert automatisch wöchentliche Lernaufgaben.

Python ist in der Entwicklungseffizienz besser als C, aber C ist in der Ausführungsleistung höher. 1. Pythons prägnante Syntax und reiche Bibliotheken verbessern die Entwicklungseffizienz. 2. Die Kompilierungsmerkmale von Compilation und die Hardwarekontrolle verbessern die Ausführungsleistung. Bei einer Auswahl müssen Sie die Entwicklungsgeschwindigkeit und die Ausführungseffizienz basierend auf den Projektanforderungen abwägen.

Ist es genug, um Python für zwei Stunden am Tag zu lernen? Es hängt von Ihren Zielen und Lernmethoden ab. 1) Entwickeln Sie einen klaren Lernplan, 2) Wählen Sie geeignete Lernressourcen und -methoden aus, 3) praktizieren und prüfen und konsolidieren Sie praktische Praxis und Überprüfung und konsolidieren Sie und Sie können die Grundkenntnisse und die erweiterten Funktionen von Python während dieser Zeit nach und nach beherrschen.

Python und C haben jeweils ihre eigenen Vorteile, und die Wahl sollte auf Projektanforderungen beruhen. 1) Python ist aufgrund seiner prägnanten Syntax und der dynamischen Typisierung für die schnelle Entwicklung und Datenverarbeitung geeignet. 2) C ist aufgrund seiner statischen Tipp- und manuellen Speicherverwaltung für hohe Leistung und Systemprogrammierung geeignet.

PythonlistsarePartThestandardlibrary, whilearraysarenot.listarebuilt-in, vielseitig und UNDUSEDFORSPORINGECollections, während dieArrayRay-thearrayModulei und loses und loses und losesaluseduetolimitedFunctionality.

Python zeichnet sich in Automatisierung, Skript und Aufgabenverwaltung aus. 1) Automatisierung: Die Sicherungssicherung wird durch Standardbibliotheken wie OS und Shutil realisiert. 2) Skriptschreiben: Verwenden Sie die PSUTIL -Bibliothek, um die Systemressourcen zu überwachen. 3) Aufgabenverwaltung: Verwenden Sie die Zeitplanbibliothek, um Aufgaben zu planen. Die Benutzerfreundlichkeit von Python und die Unterstützung der reichhaltigen Bibliothek machen es zum bevorzugten Werkzeug in diesen Bereichen.

Zu den Anwendungen von Python im wissenschaftlichen Computer gehören Datenanalyse, maschinelles Lernen, numerische Simulation und Visualisierung. 1.Numpy bietet effiziente mehrdimensionale Arrays und mathematische Funktionen. 2. Scipy erweitert die Numpy -Funktionalität und bietet Optimierungs- und lineare Algebra -Tools. 3.. Pandas wird zur Datenverarbeitung und -analyse verwendet. 4.Matplotlib wird verwendet, um verschiedene Grafiken und visuelle Ergebnisse zu erzeugen.
