Dans un gros fichier CSV, les utilisateurs rencontrent souvent le besoin de diviser les données textuelles d'une colonne en lignes distinctes pour une analyse plus facile. et la manipulation des données. Lorsque vous travaillez avec Pandas ou Python, plusieurs méthodes peuvent être utilisées pour atteindre cet objectif.
Une approche courante consiste à tirer parti de la méthode split sur la colonne souhaitée pour subdiviser le texte en fonction d'un délimiteur spécifié. Par exemple, pour diviser une colonne nommée « Seatblocks » par des espaces et des deux-points, la syntaxe suivante peut être utilisée :
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) # align with df's index s.name = 'Seatblocks' # assign a name for joining
Après avoir divisé la colonne, elle peut être rejointe avec le DataFrame d'origine à l'aide de la méthode de jointure :
del df['Seatblocks'] df.join(s)
Alternativement, pour créer des colonnes distinctes pour chaque chaîne séparée par deux points, le code suivant peut être appliqué :
df.join(s.apply(lambda x: Series(x.split(':'))))
En employant ces méthodes, les utilisateurs peuvent diviser efficacement les données textuelles en plusieurs lignes, permettant une analyse plus granulaire et une manipulation des données dans leurs efforts de programmation.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!