Diviser une colonne de tuples dans un DataFrame Pandas
Dans les dataframes Pandas, diviser une colonne contenant des tuples en plusieurs colonnes est une opération courante. Pour y parvenir, on peut adopter les méthodes suivantes :
Utilisation de pd.DataFrame(col.tolist())
Cette méthode convertit la colonne du tuple en une liste de tuples, puis crée une nouvelle trame de données à partir de ceux-ci. L'index de la nouvelle trame de données correspond à celui de l'original.
<code class="python">import pandas as pd # Create a dataframe with a column containing tuples df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]}) # Split the 'b' column into 'b1' and 'b2' df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index) # Print the resulting dataframe print(df)</code>
Sortie :
a b b1 b2 0 1 (1, 2) 1 2 1 2 (3, 4) 3 4
Remarque : Utiliser df['b'].apply(pd.Series) au lieu de pd.DataFrame(df['b'].tolist(), index=df.index) fonctionne également. Cependant, il est plus lent et nécessite plus de mémoire.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!