コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Pandas データフィルタリングの実践的なヒントと例

Pandas データフィルタリングの実践的なヒントと例

PHPz

リリース： 2024-01-24 09:23:15

オリジナル

1208 人が閲覧しました

Pandas データフィルタリングの実践的なヒントと例

Pandas をデータフィルタリングに使用するための実践的なヒント

Pandas は、データ分析とデータサイエンスで広く使用されている強力なデータ処理ライブラリです。データのフィルタリングは、データ処理中の一般的なタスクです。この記事では、Pandas を使用してデータフィルタリングを行う方法を紹介し、具体的なコード例を示します。

1. 条件に基づいてデータをフィルタリングする

条件演算子を使用してフィルタリングする

Pandas には、条件に基づいてデータをフィルタリングするためのさまざまな条件演算子が用意されています。。一般的に使用される演算子には、等しい (==)、等しくない (!=)、より大きい (>)、より小さい (=)、以下 (

たとえば、生徒の名前 (name)、年齢 (age)、およびスコア (score) を含む DataFrame オブジェクト df があると仮定すると、次のコードを使用して、スコアが大きい生徒データをフィルターで除外できます。 90 ポイント以上 :

df_filtered = df[df['score'] >= 90]

ログイン後にコピー

複数の条件を使用したフィルタリング

Pandas は、単一の条件に加えて、データフィルタリングに複数の条件を使用することもサポートしています。論理演算子 and、or、not を使用して条件を組み合わせることができます。

たとえば、18 ～ 25 歳でスコアが 80 点以上の生徒のデータをフィルターで除外するとします。次のコードを使用できます:

df_filtered = df[(df['age'] >= 18) & (df['age'] <= 25) & (df['score'] >= 80)]

ログイン後にコピー

2. インデックスに基づいてデータをフィルタリングする

Pandas の DataFrame オブジェクトは、デフォルトで整数インデックスを自動的に生成し、そのインデックスを使用してデータをフィルタリングできます。

位置インデックスを使用したフィルタリング

iloc 属性を使用すると、行と列の位置インデックスに基づいてデータをフィルタリングできます。

たとえば、行 2 から 5 のデータをフィルターで除外すると仮定すると、次のコードを使用できます:

df_filtered = df.iloc[2:6, :]

ログイン後にコピー

Use tag Index to filter

DataFrame オブジェクトにラベルインデックスが設定されている場合は、loc 属性を使用して、ラベルインデックスに基づいてデータをフィルタリングできます。

たとえば、20 歳以上の学生データをフィルターで除外すると仮定すると、次のコードを使用できます:

df_filtered = df.loc[df['age'] >= 20, :]

ログイン後にコピー

3. フィールドに基づいてデータをフィルターする

条件とインデックスによるフィルターを使用することに加えて、フィールドに基づいてデータをフィルターすることもできます。

列名に基づいてデータをフィルタリングする

列名を使用して、指定した列データをフィルタリングして除外できます。

たとえば、名前と成績の 2 つの列のデータのみをフィルターで除外すると仮定すると、次のコードを使用できます:

df_filtered = df[['name', 'score']]

ログイン後にコピー

フィールド値に基づいてデータをフィルターする

フィールドの値を使用して、フィールド値に対応するデータをフィルターで除外できます。

たとえば、スコアが 80 ～ 90 点の生徒データをフィルターで除外したいとします。次のコードを使用できます。

df_filtered = df[df['score'].between(80, 90)]

ログイン後にコピー

上記は、Pandas をデータフィルターに使用するための実用的なテクニックです。、条件、インデックス、フィールドを柔軟に使用することで、必要なデータを簡単にフィルタリングできます。この記事がデータ処理プロセスに役立つことを願っています。

以上がPandas データフィルタリングの実践的なヒントと例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

情報処理 pandas フィルター

前の記事：データクリーニングのための強力なツールである Pandas の詳細な重複排除方法を探索します。次の記事：Python で多重線形回帰モデルを実装する方法の詳細な説明

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

asfafasfasfasfasf

2025-02-28 14:37:10
人気のない意見：良いデータサイエンティストになるのはこれまで以上に難しい

2025-02-26 03:55:10
DeepSeek-V3は1：マルチヘッドの潜在的な注意を説明しました

2025-02-26 03:00:17
Verifaiを使用してローカル生成検索エンジンを簡単に展開する方法

2025-02-25 23:04:13
ChatGptの進化を理解する：パート2＆＃8211; GPT-2およびGPT-3

2025-02-25 21:02:11
検索された生成が依然として長いコンテキスト言語モデルの時代に関連する理由

2025-02-25 19:31:14
因果言語モデリングを超えて

2025-02-25 18:28:09
LLMSを使用した合成データ生成

2025-02-25 16:54:10
YouTubeアルゴリズムをリセットする方法

2025-02-24 12:34:11
古いMacの4つの賢い用途

2025-02-24 12:29:09

最新の問題

人気のあるPythonライブラリとその用途は何ですか？

2025-03-21 18:46:29
Pythonの漬物と抑えるとは何ですか？

2025-03-21 18:45:34
学習と開発のためのあなたのお気に入りのPythonリソースは何ですか？

2025-03-21 13:19:29
Pythonの環境変数をどのように操作しますか？

2025-03-21 13:16:30
PythonのGCモジュールの目的は何ですか？

2025-03-21 13:13:27

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート