用Pandas的isin()方法模拟SQL的IN/NOT IN
在数据分析中,经常需要根据DataFrame进行过滤一组值,类似于 SQL 的 IN 和 NOT IN 运算符。 Pandas 通过 isin() 方法提供了一个简单的解决方案。
isin() 方法对 Pandas Series 进行操作,并测试该系列中的每个元素是否包含在指定的列表或集合中。要复制 SQL 的 IN,只需将 isin(list) 应用于所需的列:
>>> countries_to_keep = ['UK', 'China'] >>> df.country.isin(countries_to_keep)
对于 NOT IN,请使用否定运算符 (~):
>>> df[~df.country.isin(countries_to_keep)]
isin()方法简化了数据过滤,消除了如初始代码示例中所示的繁琐合并操作的需要。它的语法反映了 SQL 的 IN/NOT IN,使其可以轻松合并到您的 Pandas 工作流程中。
以上是如何使用 Pandas 的 isin() 方法模拟 SQL 的 IN 和 NOT IN 运算符?的详细内容。更多信息请关注PHP中文网其他相关文章!