Pandas-Methode zum Aufteilen von Text in mehrere Zeilen
Problem:
Eine große CSV-Datei enthält eine Spalte mit Textzeichenfolgen, die anhand bestimmter Trennzeichen in mehrere Zeilen aufgeteilt werden müssen. Das Ziel besteht darin, für jeden Satz geteilten Textes separate Zeilen zu erstellen.
Lösung mit Pandas:
Aufgeteilt durch Leerzeichen und Doppelpunkt:
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) s.name = 'Seatblocks' del df['Seatblocks'] df.join(s)
Beispielausgabe:
CustNum CustomerName ItemQty Item ItemExt Seatblocks 0 32363 McCartney, Paul 3 F04 60 2:218:10:4,6 1 31316 Lennon, John 25 F01 300 1:13:36:1,12 1 31316 Lennon, John 25 F01 300 1:13:37:1,13
Aufgeteilt nach Doppelpunkt:
df.join(s.apply(lambda x: Series(x.split(':'))))
Beispielausgabe:
CustNum CustomerName ItemQty Item ItemExt 0 1 2 3 0 32363 McCartney, Paul 3 F04 60 2 218 10 4,6 1 31316 Lennon, John 25 F01 300 1 13 36 1,12 1 31316 Lennon, John 25 F01 300 1 13 37 1,13
Das obige ist der detaillierte Inhalt vonWie kann ich Textzeichenfolgen mithilfe von Pandas basierend auf bestimmten Trennzeichen in mehrere Zeilen aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!