ホームページ バックエンド開発 Python チュートリアル groupby 操作中に Pandas DataFrame 内の他の列を維持するにはどうすればよいですか?

groupby 操作中に Pandas DataFrame 内の他の列を維持するにはどうすればよいですか?

Oct 27, 2024 am 09:09 AM

How can I maintain other columns in a Pandas DataFrame during a groupby operation?

Groupby 操作中の他の列の維持

pandas データフレームで groupby 操作を実行する場合、多くの場合、そうでない列を保持する必要があります。グループ化または集約プロセスに関与します。デフォルトでは、これらの他の列は操作が完了すると削除されます。保持された列に貴重な情報が含まれている場合、これは問題となる可能性があります。

次のデータ フレームを考えてみましょう:

    item    diff   otherstuff
   0   1       2            1
   1   1       1            2
   2   1       3            7
   3   2      -1            0
   4   2       1            3
   5   2       4            9
   6   2      -6            2
   7   3       0            0
   8   3       2            9
ログイン後にコピー

データ フレームを「item」列でグループ化し、 「diff」列の最小値を指定すると、結果のデータ フレームは次のようになります。

    item   diff
   0   1      1           
   1   2     -6           
   2   3      0                 
ログイン後にコピー

「otherstuff」列が削除されていることに注意してください。この列を保持するには、idxmin() メソッドを使用して最小 diff の要素のインデックスを取得し、それらを選択します。

>>> df.loc[df.groupby("item")["diff"].idxmin()]
   item  diff  otherstuff
1     1     1           2
6     2    -6           2
7     3     0           0

[3 rows x 3 columns]
ログイン後にコピー

もう 1 つの方法は、データ フレームを「diff」で並べ替えることです。 " 列を選択し、各項目グループの最初の要素を取得します:

>>> df.sort_values("diff").groupby("item", as_index=False).first()
   item  diff  otherstuff
0     1     1           2
1     2    -6           2
2     3     0           0

[3 rows x 3 columns]
ログイン後にコピー

これらのメソッドは両方とも、「otherstuff」列を保持しながら、目的の結果を生成します。行の内容が同じであっても、結果のインデックスは異なる場合があることに注意してください。

以上がgroupby 操作中に Pandas DataFrame 内の他の列を維持するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットな記事タグ

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

HTMLを解析するために美しいスープを使用するにはどうすればよいですか? HTMLを解析するために美しいスープを使用するにはどうすればよいですか? Mar 10, 2025 pm 06:54 PM

HTMLを解析するために美しいスープを使用するにはどうすればよいですか?

Pythonでの画像フィルタリング Pythonでの画像フィルタリング Mar 03, 2025 am 09:44 AM

Pythonでの画像フィルタリング

Pythonでファイルをダウンロードする方法 Pythonでファイルをダウンロードする方法 Mar 01, 2025 am 10:03 AM

Pythonでファイルをダウンロードする方法

Pythonを使用してテキストファイルのZIPF配布を見つける方法 Pythonを使用してテキストファイルのZIPF配布を見つける方法 Mar 05, 2025 am 09:58 AM

Pythonを使用してテキストファイルのZIPF配布を見つける方法

Pythonを使用してPDFドキュメントの操作方法 Pythonを使用してPDFドキュメントの操作方法 Mar 02, 2025 am 09:54 AM

Pythonを使用してPDFドキュメントの操作方法

DjangoアプリケーションでRedisを使用してキャッシュする方法 DjangoアプリケーションでRedisを使用してキャッシュする方法 Mar 02, 2025 am 10:10 AM

DjangoアプリケーションでRedisを使用してキャッシュする方法

TensorflowまたはPytorchで深い学習を実行する方法は? TensorflowまたはPytorchで深い学習を実行する方法は? Mar 10, 2025 pm 06:52 PM

TensorflowまたはPytorchで深い学習を実行する方法は?

Natural Language Toolkit(NLTK)の紹介 Natural Language Toolkit(NLTK)の紹介 Mar 01, 2025 am 10:05 AM

Natural Language Toolkit(NLTK)の紹介

See all articles