Pandas と Python を使用して、列内のテキストを複数の行に分割するにはどうすればよいですか?

Patricia Arquette
リリース: 2024-11-10 00:16:02
オリジナル
977 人が閲覧しました

How can I split text in a column into multiple rows using Pandas and Python?

列内のテキストを複数の行に分割する

大きな CSV ファイルを操作する場合、特定の列のテキストを分割することが必要になる場合があります。複数の行に分割します。 Pandas と Python は、このタスクを達成するための効率的な方法を提供します。

Pandas の使用

  1. スペースで分割:

    df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
    ログイン後にコピー

    これにより、「シートブロック」列の各行がスペースで分割され、結果の文字列ごとに新しい列が作成されます。

  2. コロンで分割:

    df['Seatblocks'].str.split(' ').apply(lambda x: Series(x.split(':')))
    ログイン後にコピー

    これにより、新しい列の各文字列がコロンでさらに分割され、コロンで区切られた文字列ごとに複数の列が作成されます。

次の CSV ファイルについて考えてみましょう:

CustNum CustomerName ItemQty Item Seatblocks ItemExt
32363 McCartney, Paul 3 F04 2:218:10:4,6 60
31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300

上記の方法を使用すると、「Seatblocks」列を複数の行に分割できます:

CustNum CustomerName ItemQty Item Seatblocks1 Seatblocks2 Seatblocks3 Seatblocks4 ItemExt
32363 McCartney, Paul 3 F04 2 218 10 4,6 60
31316 Lennon, John 25 F01 1 13 36 1,12 300
31316 Lennon, John 25 F01 1 13 37 1,13 300

結論

Pandas の分割およびスタック操作を利用することで、列内のテキスト データを複数の行に効率的に再構築でき、さらなる分析と操作が可能になります。

以上がPandas と Python を使用して、列内のテキストを複数の行に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート