大きな CSV ファイルでは、分析を容易にするために、列内のテキスト データを個別の行に分割する必要が生じることがよくあります。そしてデータ操作。 pandas または Python を使用する場合、この目的を達成するためにいくつかの方法を使用できます。
一般的なアプローチの 1 つは、目的の列で分割メソッドを利用して、指定された区切り文字に基づいてテキストを細分化することです。たとえば、「Seatblocks」という名前の列をスペースとコロンで分割するには、次の構文を使用できます:
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) # align with df's index s.name = 'Seatblocks' # assign a name for joining
列を分割した後、join メソッドを使用して元の DataFrame に再結合できます。
del df['Seatblocks'] df.join(s)
あるいは、コロンで区切られた文字列ごとに個別の列を作成するには、次のコードを実行できます。適用:
df.join(s.apply(lambda x: Series(x.split(':'))))
これらのメソッドを採用することで、ユーザーはテキスト データを効果的に複数の行に分割でき、プログラミング作業においてより詳細な分析とデータ操作が可能になります。
以上がpandas DataFrame で列内のテキストを複数の行に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。