Aufteilen einer Spalte mit Tupeln in einem Pandas-Datenrahmen
In Pandas-Datenrahmen ist das Aufteilen einer Spalte mit Tupeln in mehrere Spalten ein üblicher Vorgang. Um dies zu erreichen, kann man die folgenden Methoden anwenden:
Verwenden von pd.DataFrame(col.tolist())
Diese Methode konvertiert die Tupelspalte in eine Liste von Tupel und erstellt daraus dann einen neuen Datenrahmen. Der Index des neuen Datenrahmens stimmt mit dem des Originals überein.
<code class="python">import pandas as pd # Create a dataframe with a column containing tuples df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]}) # Split the 'b' column into 'b1' and 'b2' df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index) # Print the resulting dataframe print(df)</code>
Ausgabe:
a b b1 b2 0 1 (1, 2) 1 2 1 2 (3, 4) 3 4
Hinweis: Verwenden Sie df['b'].apply(pd.Series) anstelle von pd.DataFrame(df['b'].tolist(), index=df.index) funktioniert auch. Allerdings ist es langsamer und benötigt mehr Speicher.
Das obige ist der detaillierte Inhalt vonWie teile ich eine Tupelspalte in mehrere Spalten in einem Pandas-DataFrame auf?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!