Pandas DataFrame を使用する場合、特定の列の特定の値に基づいて行をフィルタリングする必要が生じることがよくあります。これは、WHERE column_name = some_value のようなフィルターを使用して行が取得される SQL クエリを模倣しています。
列の値がスカラー値 some_value と一致する行を選択するには、等価演算子 == を使用します。 :
df.loc[df['column_name'] == some_value]
列の値が配列 some_values にある行を選択するには、isin メソッドを使用します。
df.loc[df['column_name'].isin(some_values)]
複数の条件は、論理 & 演算子:
df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]
注:演算子の優先順位が正しいことを確認するには、かっこを使用します。
列の値が some_value と等しくない行を選択するには、不等演算子 !=:
df.loc[df['column_name'] != some_value]
を使用します。 isin の場合、次を使用して結果を否定します。 ~:
df = df.loc[~df['column_name'].isin(some_values)]
次の DataFrame について考えます:
import pandas as pd df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.arange(8), 'D': np.arange(8) * 2}) print(df)
A が foo である行を選択します:
print(df.loc[df['A'] == 'foo'])
B が 1 である行を選択、または3 つ:
print(df.loc[df['B'].isin(['one', 'three'])])
インデックスを作成し、それを使用して行を選択します:
df = df.set_index(['B']) print(df.loc['one'])
複数のインデックス値を持つ行を選択します:
print(df.loc[df.index.isin(['one', 'two'])])
以上が列の値に基づいて Pandas DataFrame の特定の行を選択する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。