データ分析では、多くの場合、事前定義された基準に基づいてデータフレームから特定の行を取得する必要があります。 Pandas は、値のリストに基づいて行を選択する機能など、データフレームをサブセット化するためのさまざまなメソッドを提供します。
値のリストに基づいて Pandas データフレームをサブセットするには、示されているように、 isin() メソッドを使用できます。以下:
import pandas as pd # Create a Pandas dataframe df = pd.DataFrame({'A': [5, 6, 3, 4], 'B': [1, 2, 3, 5]}) # Define a list of values to filter by list_of_values = [3, 6] # Subset dataframe based on the list y = df[df['A'].isin(list_of_values)] print(y)
出力:
A B 1 6 2 2 3 3
isin() メソッドを使用すると、指定された列の値が提供されたリスト内のいずれかの値と一致する行をフィルターできます。
による選択の無効化 特定のシナリオでは、値のリストに基づいて行を除外する必要がある場合があります。これを実現するには、以下に示すように ~ 演算子を isin() とともに使用できます。
import pandas as pd # Create a Pandas dataframe df = pd.DataFrame({'A': [5, 6, 3, 4], 'B': [1, 2, 3, 5]}) # Define a list of values to exclude list_of_values = [3, 6] # Subset dataframe excluding the list z = df[~df['A'].isin(list_of_values)] print(z)
出力:
A B 0 5 1 3 4 5
~ 演算子は選択を否定し、行が確実に指定されたリストにない値を含む値が表示されます。
以上が値のリストを使用して Pandas DataFrame をサブセット化する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。