Pandas によるデータのフィルタリング方法: 1. Pandas ライブラリをインポートする; 2. データを読み取る; 3. データをフィルタリングする; 4. データを並べ替える; 5. データをグループ化して集計するなど。詳細な紹介: 1. Pandas ライブラリをインポートします。まず、Pandas ライブラリがインストールされていることを確認します。インストールされていない場合は、「pip install pandas」コマンドを使用してインストールし、「import pandas」コマンドを使用できます。 as pd" コマンドで Pandas ライブラリをインポートします。 2. Pandas ライブラリなどを使用してデータを読み取ります。
このチュートリアルのオペレーティング システム: Windows 10 システム、DELL G3 コンピューター。
Pandas は、データを簡単にフィルター、処理、分析できるようにする多くの強力な機能を提供する人気の Python データ分析ライブラリです。 Pandas を使用してデータをフィルタリングする一般的な方法は次のとおりです:
1. Pandas ライブラリをインポートします
まず、Pandas ライブラリがインストールされていることを確認します。インストールされていない場合は、次のコマンドを使用してインストールできます:
pip install pandas
次に、Pandas ライブラリをインポートします:
import pandas as pd
2. データの読み取り
Use read_csv( ) Pandas ライブラリ内のこの関数は CSV ファイルを読み取り、read_excel() 関数は Excel ファイルなどを読み取ります。たとえば、data.csv という名前の CSV ファイルを読み取ります:
df = pd.read_csv('data.csv')
3. データのフィルター
Pandas には、データをフィルターするためのさまざまなメソッドが用意されています。一般的な方法をいくつか次に示します。
(1) 条件に基づいてフィルタリングする
loc 属性と iloc 属性、および論理演算子 (&、|、~ など) を使用してデータをフィルタリングします。たとえば、年齢が 18 歳以上で性別が女性のデータをフィルタリングするには:
df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]
(2) タグに基づくフィルタリング
loc 属性を使用してデータをフィルタリングします。特定のタグの場合。たとえば、姓が「Zhang」のデータをフィルタするには:
df.loc[df['last_name'] == '张']
(3) 範囲によるフィルタ
loc 属性を使用して、特定の範囲内のデータをフィルタします。たとえば、18 歳から 30 歳までのデータをフィルターします。
df.loc[(df['age'] >= 18) & (df['age'] <= 30)]
(4) 複数の条件でフィルターする
クエリ メソッドを使用して、複数の条件を満たすデータをフィルターします。たとえば、年齢が 18 歳以上で性別が女性のデータをフィルターするには:
df.query('age >= 18 & gender == "female"')
4. データの並べ替え
sort_values() メソッドを使用してデータを並べ替えます。 。たとえば、年齢で昇順に並べ替えます:
df.sort_values('age', ascending=True)
5. グループ化された集計データ
groupby() メソッドを使用してデータをグループ化し、集計関数 (sum()、 means()、count() など) はグループごとに計算されます。たとえば、各性別グループの平均年齢を計算するには:
df.groupby('gender').mean()['age']
以上がパンダでデータをフィルタリングする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。