2 つの変数によるロングからワイドへのパンダの再形成
ロング形式とワイド形式の間でデータを操作することは、データ分析における一般的なタスクです。 Python の Pandas ライブラリでは、この目的のためにメルト操作とスタック/アンスタック操作が一般的に使用されます。ただし、より単純なアプローチが必要な特定のシナリオが発生する可能性があります。
そのようなシナリオの 1 つは、2 つの変数 (売上などの数値変数と製品などのカテゴリ変数など) を含むデータをワイド形式に再構成する場合です。 。メルト/スタック/アンスタックのメソッドだけを使用すると、目的の出力が得られない可能性があります。
この例では、Salesman、Height、product、price の列を含む「長い」データがあります。私たちの目標は、このデータを、対応する価格を含む各固有の製品の列を含む「ワイド」形式に再形成することです。
Salesman Height product price Knut 6 bat 5 Knut 6 ball 1 Knut 6 wand 3 Steve 5 pen 2
これを達成するには、Pandas のピボット機能を利用できます。ピボットテーブルの作り方。インデックス列 (Salesman)、ピボット列 (obs)、および値列 (price) を指定します。
データを再構成する Python コードは次のとおりです。
<code class="python">wide_df = df.pivot(index='Salesman', columns='product', values='price')</code>
これにより、希望する「ワイド」形式:
Salesman Height product_1 price_1 product_2 price_2 product_3 price_3 Knut 6 bat 5 ball 1 wand 3 Steve 5 pen 2 NA NA NA NA
以上が2 つの変数を使用して Pandas で長いデータから広いデータに再形成する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。