Pandas の isin() メソッドを使用した SQL の IN/NOT IN のシミュレーション
データ分析では、DataFrame ベースのフィルター処理が必要になるのが一般的です。 SQL の IN 演算子と NOT IN 演算子に似た、一連の値に対する演算です。 Pandas は、 isin() メソッドを使用した簡単なソリューションを提供します。
isin() メソッドは Pandas シリーズに対して動作し、シリーズ内の各要素が指定されたリストまたはセットに含まれているかどうかをテストします。 SQL の IN を複製するには、単純に isin(list) を目的の列に適用します:
>>> countries_to_keep = ['UK', 'China'] >>> df.country.isin(countries_to_keep)
NOT IN の場合は、否定演算子 (~) を使用します:
>>> df[~df.country.isin(countries_to_keep)]
isin()このメソッドはデータのフィルタリングを簡素化し、最初のコード サンプルで見られたような面倒なマージ操作の必要性を排除します。その構文は SQL の IN/NOT IN を反映しているため、Pandas ワークフローに簡単に組み込むことができます。
以上がPandas の isin() メソッドを使用して SQL の IN 演算子と NOT IN 演算子をシミュレートするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。