列内のテキストを複数の行に分割する
大きな CSV ファイルを操作する場合、特定の列のテキストを分割することが必要になる場合があります。複数の行に分割します。 Pandas と Python は、このタスクを達成するための効率的な方法を提供します。
Pandas の使用
スペースで分割:
df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
これにより、「シートブロック」列の各行がスペースで分割され、結果の文字列ごとに新しい列が作成されます。
コロンで分割:
df['Seatblocks'].str.split(' ').apply(lambda x: Series(x.split(':')))
これにより、新しい列の各文字列がコロンでさらに分割され、コロンで区切られた文字列ごとに複数の列が作成されます。
例
次の CSV ファイルについて考えてみましょう:
CustNum | CustomerName | ItemQty | Item | Seatblocks | ItemExt |
---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2:218:10:4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1:13:36:1,12 1:13:37:1,13 | 300 |
上記の方法を使用すると、「Seatblocks」列を複数の行に分割できます:
CustNum | CustomerName | ItemQty | Item | Seatblocks1 | Seatblocks2 | Seatblocks3 | Seatblocks4 | ItemExt |
---|---|---|---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2 | 218 | 10 | 4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 36 | 1,12 | 300 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 37 | 1,13 | 300 |
結論
Pandas の分割およびスタック操作を利用することで、列内のテキスト データを複数の行に効率的に再構築でき、さらなる分析と操作が可能になります。
以上がPandas と Python を使用して、列内のテキストを複数の行に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。