In einer großen CSV-Datei müssen Benutzer häufig Textdaten in einer Spalte zur einfacheren Analyse in separate Zeilen aufteilen und Datenmanipulation. Bei der Arbeit mit Pandas oder Python können mehrere Methoden eingesetzt werden, um dieses Ziel zu erreichen.
Ein gängiger Ansatz besteht darin, die Split-Methode für die gewünschte Spalte zu nutzen, um den Text basierend auf einem angegebenen Trennzeichen zu unterteilen. Um beispielsweise eine Spalte mit dem Namen „Seatblocks“ durch Leerzeichen und Doppelpunkte zu teilen, kann die folgende Syntax verwendet werden:
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) # align with df's index s.name = 'Seatblocks' # assign a name for joining
Nach dem Teilen der Spalte kann sie mithilfe der Join-Methode wieder mit dem ursprünglichen DataFrame verbunden werden:
del df['Seatblocks'] df.join(s)
Alternativ können Sie zum Erstellen separater Spalten für jede durch Doppelpunkte getrennte Zeichenfolge den folgenden Code verwenden angewendet:
df.join(s.apply(lambda x: Series(x.split(':'))))
Durch den Einsatz dieser Methoden können Benutzer Textdaten effektiv in mehrere Zeilen aufteilen, was eine detailliertere Analyse und Datenmanipulation bei ihren Programmierbemühungen ermöglicht.
Das obige ist der detaillierte Inhalt vonWie teilt man Text in einer Spalte in mehrere Zeilen in einem Pandas-DataFrame auf?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!