Pandas を使用して適格なデータをフィルタリングする方法
Pandas は、豊富なデータ処理および操作機能を提供する Python の強力なデータ分析ライブラリです。実際のデータ分析や処理のプロセスでは、特定の条件を満たすデータを見つけるためにデータをフィルタリングする必要があることがよくあります。この記事では、Pandas を使用してデータ フィルタリングを行う方法を紹介し、具体的なコード例を示します。
1. Pandas ライブラリをインポートする
Pandas を使用する前に、まず関連するライブラリをインポートする必要があります。次のコマンドを使用して Pandas ライブラリをインポートできます:
import pandas as pd
2. データ フレームの作成
データをフィルタリングする前に、データを作成する必要があります。まずはフレーム。データ フレームは、Excel のテーブルと同様に、Pandas で一般的に使用されるデータ構造であり、データを簡単に保存および処理できます。以下は、単純なデータ フレームを作成するサンプル コードです:
data = {'Name': ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu'],
'Age': [25, 30, 35, 40], 'Gender': ['男', '女', '男', '女'], 'Salary': [5000, 6000, 7000, 8000]}
df = pd.DataFrame(data)
3. 条件に基づいてデータをフィルターする
Pandas では、いくつかのメソッドを使用して条件に基づいてデータをフィルターできます。一般的に使用されるメソッドをいくつか次に示します。
loc メソッドは、行ラベルと列ラベルに基づいてデータをフィルタリングできます。以下は、loc メソッドを使用して 30 年以上古いデータをフィルターするサンプル コードです:
filtered_data = df.loc[df['Age'] > 30]
iloc メソッドは、行インデックスと列インデックスに基づいてデータをフィルタリングできます。以下は、iloc メソッドを使用して行 3 のデータをフィルター処理するサンプル コードです:
filtered_data = df.iloc[2]
以上がPandasを使って条件を満たすデータを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。