テキストを複数の行に分割するパンダのメソッド
問題:
大きな CSV ファイルに列が含まれています特定の区切り文字に基づいて複数の行に分割する必要があるテキスト文字列を含む。目標は、分割テキストのセットごとに個別の行を作成することです。
Pandas を使用した解決策:
スペースとコロンで分割:
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) s.name = 'Seatblocks' del df['Seatblocks'] df.join(s)
出力例:
CustNum CustomerName ItemQty Item ItemExt Seatblocks 0 32363 McCartney, Paul 3 F04 60 2:218:10:4,6 1 31316 Lennon, John 25 F01 300 1:13:36:1,12 1 31316 Lennon, John 25 F01 300 1:13:37:1,13
コロンによる分割:
df.join(s.apply(lambda x: Series(x.split(':'))))
出力例:
CustNum CustomerName ItemQty Item ItemExt 0 1 2 3 0 32363 McCartney, Paul 3 F04 60 2 218 10 4,6 1 31316 Lennon, John 25 F01 300 1 13 36 1,12 1 31316 Lennon, John 25 F01 300 1 13 37 1,13
以上がPandas を使用して特定の区切り文字に基づいてテキスト文字列を複数の行に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。