列の値で Pandas DataFrame を分割する方法
列の値に基づいて Pandas DataFrame を分割すると、個別のサブセットを作成するのに役立ちますデータの。 「Sales」という名前の列を持つ DataFrame があり、それを 2 つの DataFrame に分割するとします。1 つは「Sales」が指定値未満の行を含むもので、もう 1 つは「Sales」が指定値以上の行を含むものです。
これを実現するには、次の手順でブール型インデックスを使用します。
DataFrame を分割します: 適用元の DataFrame にブール マスクを適用して、2 つの新しい DataFrame を作成します:
または、~ 演算子を使用して最初のマスクを反転できます。
mask = df['Sales'] >= s df1 = df[mask] df2 = df[~mask]<p>次に示します。プロセスを説明する例:</p> <pre class="brush:php;toolbar:false"><code class="python">df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]}) print(df) s = 30 df1 = df[df['Sales'] >= s] print(df1) df2 = df[df['Sales'] < s] print(df2)</code>
出力は次のようになります:
A Sales 0 3 10 1 4 20 2 7 30 3 6 40 4 1 50 A Sales 2 7 30 3 6 40 4 1 50 A Sales 0 3 10 1 4 20
これは、ブール インデックスを使用して、指定された列値に基づいて Pandas DataFrame を 2 つに分割する方法を示しています。
以上がPandas DataFrame を列値で分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。