ホームページ バックエンド開発 Python チュートリアル Python の「itertools.groupby()」関数は、指定されたキーに基づいて反復可能なデータを効率的にグループ化するにはどうすればよいでしょうか?

Python の「itertools.groupby()」関数は、指定されたキーに基づいて反復可能なデータを効率的にグループ化するにはどうすればよいでしょうか?

Dec 17, 2024 am 06:57 AM

How can Python's `itertools.groupby()` function efficiently group iterable data based on a specified key?

itertools.groupby() について: Python でのデータのグループ化

Intertools.groupby() は、グループ化を可能にする強力な Python 関数です。指定されたキー関数に基づく反復可能要素。これは、データを論理カテゴリに分割する必要がある場合、または関連項目のグループに対して操作を実行する必要がある場合に特に役立ちます。

itertools.groupby() を使用するには、グループ化するデータとキーの 2 つの引数を指定します。グループ化基準を決定する関数。 key 関数は、データ内の各要素を受け入れ、要素をグループ化するための値を返します。

注意すべき重要な点の 1 つは、groupby() はグループ化する前にデータを並べ替えないことです。グループを並べ替える必要がある場合は、groupby() を適用する前にデータを自分で並べ替える必要がある場合があります。

使用例

を示す例を考えてみましょう。 itertools.groupby() の使用法:

from itertools import groupby

# Data to group: a list of tuples representing (fruit, size) pairs
data = [('apple', 'small'), ('banana', 'medium'), ('orange', 'large'),
         ('apple', 'large'), ('banana', 'small'), ('pear', 'small')]

# Define the key function to group by fruit type
key_func = lambda item: item[0]

# Group the data by fruit type
grouped = groupby(data, key_func)
ログイン後にコピー

グループ化後、grouped は (key,グループ)ペア。各キーは一意のフルーツ タイプを表し、グループはそのフルーツ タイプに属する元のタプルの反復子です。

グループの反復

それぞれを反復するにはグループ化されたイテレータ内のグループでは、ネストされたループ:

for fruit_type, group_iterator in grouped:
    # Iterate over the current group, which contains tuples for the fruit type
    for fruit, size in group_iterator:
        # Process the fruit and size
        print(f'{fruit} is {size}')
ログイン後にコピー

代替アプローチ

場合によっては、groupby() が最も効率的な選択肢ではない状況に遭遇することがあります。非常に大規模なデータセットを操作している場合、または主要な関数が特に複雑な場合、groupby() の計算コストが高くなる可能性があります。

次の代替案を検討してください:

  • コレクション。 defaultdict(list): まだ作成されていないキーごとに新しいリストを自動的に作成する辞書present.
  • Pandas DataFrame.groupby(): Pandas ライブラリによって提供される、より包括的なデータ グループ化メカニズム。

追加リソース

itertools.groupby() について詳しくは、以下を参照してください。リソース:

  • [Python itertools.groupby() ドキュメント](https://docs.python.org/3/library/itertools.html#itertools.groupby)
  • [ Python itertools groupby() 関数チュートリアル](https://www.datacamp.com/courses/itertools-python-tutorial)

以上がPython の「itertools.groupby()」関数は、指定されたキーに基づいて反復可能なデータを効率的にグループ化するにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか? 中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか? Apr 02, 2025 am 07:15 AM

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は? プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は? Apr 02, 2025 am 07:18 AM

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

Investing.comの反クローラーメカニズムをバイパスするニュースデータを取得する方法は? Investing.comの反クローラーメカニズムをバイパスするニュースデータを取得する方法は? Apr 02, 2025 am 07:03 AM

Investing.comの反クラウリング戦略を理解する多くの人々は、Investing.com(https://cn.investing.com/news/latest-news)からのニュースデータをクロールしようとします。

Python 3.6のロードピクルスファイルエラーmodulenotfounderror:ピクルスファイル「__builtin__」をロードした場合はどうすればよいですか? Python 3.6のロードピクルスファイルエラーmodulenotfounderror:ピクルスファイル「__builtin__」をロードした場合はどうすればよいですか? Apr 02, 2025 am 06:27 AM

Python 3.6のピクルスファイルの読み込みエラー:modulenotfounderror:nomodulenamed ...

Scapy Crawlerを使用するときにパイプラインファイルを書き込めない理由は何ですか? Scapy Crawlerを使用するときにパイプラインファイルを書き込めない理由は何ですか? Apr 02, 2025 am 06:45 AM

SCAPYクローラーを使用するときにパイプラインファイルを作成できない理由についての議論は、SCAPYクローラーを学習して永続的なデータストレージに使用するときに、パイプラインファイルに遭遇する可能性があります...

See all articles