Pandas MultiIndex DataFrame を元の形式に変換する
Pandas DataFrame を操作する場合、データを集約するためにグループ化操作を実行するのが一般的です。ただし、グループ化後のデータフレームには複数のインデックス階層が含まれる可能性があり、作業が困難になる可能性があります。この記事では、サンプル DataFrame を使用した簡単なデモンストレーションとともに、マルチインデックス DataFrame を元の形式に変換する方法について説明します。
問題
指定されたサンプルDataFrame には、「City」と「Name」の列を含む複数行のデータが含まれています。 DataFrame に対して GroupBy 操作を実行し、count() 関数を使用して「名前」と「市区町村」で集計します。結果のグループ化された DataFrame には、("Name", "City") のマルチインデックスがあります。
解決策
マルチインデックス DataFrame を元のデータフレームに変換するには元の形式では、add_suffix() 関数とreset_index() 関数を使用できます。 add_suffix() 関数は列名にサフィックスを追加し、reset_index() 関数はマルチインデックスを単一インデックスの DataFrame に変換します。
g1.add_suffix('_Count').reset_index()
結果の DataFrame には、追加された元の行が含まれます。列「_Count」は、「名前」と「市区町村」の各組み合わせの数を表します。
代替Method
マルチインデックス DataFrame を変換するもう 1 つの方法は、DataFrame() 関数と size() 関数を使用して新しい DataFrame を作成し、「Name」と「」の各組み合わせの行をカウントすることです。 City".
DataFrame({'count' : df1.groupby( [ "Name", "City"] ).size()}).reset_index()
このメソッドでは add_suffix() 関数を使用する必要はありませんが、単一の「カウント」を持つ DataFrame が生成されます。
これらのメソッドを利用すると、マルチインデックス データフレームを元の形式に簡単に変換でき、さらなるデータ操作や分析タスクが容易になります。
🎜>以上がPandas MultiIndex データフレームを元の単一インデックス形式に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。