ホームページ > バックエンド開発 > Python チュートリアル > 2 つの変数を使用して Pandas で長いデータから広いデータに再形成する方法は?

2 つの変数を使用して Pandas で長いデータから広いデータに再形成する方法は?

Susan Sarandon
リリース: 2024-10-29 18:05:02
オリジナル
935 人が閲覧しました

How to Reshape Long to Wide Data in Pandas Using Two Variables?

2 つの変数によるロングからワイドへのパンダの再形成

ロング形式とワイド形式の間でデータを操作することは、データ分析における一般的なタスクです。 Python の Pandas ライブラリでは、この目的のためにメルト操作とスタック/アンスタック操作が一般的に使用されます。ただし、より単純なアプローチが必要な特定のシナリオが発生する可能性があります。

そのようなシナリオの 1 つは、2 つの変数 (売上などの数値変数と製品などのカテゴリ変数など) を含むデータをワイド形式に再構成する場合です。 。メルト/スタック/アンスタックのメソッドだけを使用すると、目的の出力が得られない可能性があります。

この例では、Salesman、Height、product、price の列を含む「長い」データがあります。私たちの目標は、このデータを、対応する価格を含む各固有の製品の列を含む「ワイド」形式に再形成することです。

Salesman  Height   product      price
  Knut      6        bat          5
  Knut      6        ball         1
  Knut      6        wand         3
  Steve     5        pen          2
ログイン後にコピー

これを達成するには、Pandas のピボット機能を利用できます。ピボットテーブルの作り方。インデックス列 (Salesman)、ピボット列 (obs)、および値列 (price) を指定します。

データを再構成する Python コードは次のとおりです。

<code class="python">wide_df = df.pivot(index='Salesman', columns='product', values='price')</code>
ログイン後にコピー

これにより、希望する「ワイド」形式:

Salesman  Height    product_1  price_1  product_2 price_2 product_3 price_3  
  Knut      6        bat          5       ball      1        wand      3
  Steve     5        pen          2        NA       NA        NA       NA
ログイン後にコピー

以上が2 つの変数を使用して Pandas で長いデータから広いデータに再形成する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート