Text in einer Spalte in mehrere Zeilen aufteilen
Beim Arbeiten mit großen CSV-Dateien kann es notwendig sein, Text in einer bestimmten Spalte aufzuteilen in mehrere Reihen aufteilen. Pandas und Python bieten effiziente Methoden, um diese Aufgabe zu erfüllen.
Pandas verwenden
Nach Leerzeichen aufteilen:
df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
Dadurch wird jede Zeile in der Spalte „Sitzblöcke“ durch Leerzeichen geteilt und für jede resultierende Zeichenfolge eine neue Spalte erstellt.
Nach Doppelpunkt getrennt:
df['Seatblocks'].str.split(' ').apply(lambda x: Series(x.split(':')))
Dadurch wird jede Zeichenfolge in der neuen Spalte weiter durch Doppelpunkte aufgeteilt, wodurch mehrere Spalten für jede durch Doppelpunkte getrennte Zeichenfolge erstellt werden.
Beispiel
Betrachten Sie diese CSV-Datei:
CustNum | CustomerName | ItemQty | Item | Seatblocks | ItemExt |
---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2:218:10:4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1:13:36:1,12 1:13:37:1,13 | 300 |
Mit den oben genannten Methoden kann die Spalte „Sitzblöcke“ in mehrere Zeilen aufgeteilt werden:
CustNum | CustomerName | ItemQty | Item | Seatblocks1 | Seatblocks2 | Seatblocks3 | Seatblocks4 | ItemExt |
---|---|---|---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2 | 218 | 10 | 4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 36 | 1,12 | 300 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 37 | 1,13 | 300 |
Fazit
Durch die Nutzung der Aufteilungs- und Stapelvorgänge von Pandas ist es möglich, Textdaten in einer Spalte effizient in mehrere Zeilen umzustrukturieren, was eine weitere Analyse und Bearbeitung ermöglicht.
Das obige ist der detaillierte Inhalt vonWie kann ich mit Pandas und Python Text in einer Spalte in mehrere Zeilen aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!