Méthode Pandas pour diviser le texte en plusieurs lignes
Problème :
Un gros fichier CSV contient une colonne avec des chaînes de texte qui doivent être divisées en plusieurs lignes en fonction de délimiteurs spécifiques. L'objectif est de créer des lignes distinctes pour chaque ensemble de texte fractionné.
Solution utilisant Pandas :
Divisé par espace et deux points :
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) s.name = 'Seatblocks' del df['Seatblocks'] df.join(s)
Exemple de sortie :
CustNum CustomerName ItemQty Item ItemExt Seatblocks 0 32363 McCartney, Paul 3 F04 60 2:218:10:4,6 1 31316 Lennon, John 25 F01 300 1:13:36:1,12 1 31316 Lennon, John 25 F01 300 1:13:37:1,13
Divisé par Deux points :
df.join(s.apply(lambda x: Series(x.split(':'))))
Exemple de sortie :
CustNum CustomerName ItemQty Item ItemExt 0 1 2 3 0 32363 McCartney, Paul 3 F04 60 2 218 10 4,6 1 31316 Lennon, John 25 F01 300 1 13 36 1,12 1 31316 Lennon, John 25 F01 300 1 13 37 1,13
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!