在 Pandas 中使用 groupby 函数时,apply 方法可能会出现对第一个函数应用两次的情况数据框的行。这种行为虽然看似意外,但却是设计使然。
apply 函数需要确定它将组合的数据的形状。为了实现这一点,它调用指定的函数(在本例中为 checkit)两次。第一个调用有助于推断输出的形状,而第二个调用则对组执行操作。
根据您的用例,您可以通过使用替代方法来避免双重应用函数:
这些函数强制返回值的特定形状,从而消除了双重应用程序的需要。
如果您正在应用的函数没有副作用,即,它不会修改原始数据框——那么双重应用程序可能并不重要。然而,如果函数执行任何数据操作,第一行的双重应用可能会导致意想不到的后果。
以上是为什么 Pandas GroupBy.apply 似乎重复第一行?的详细内容。更多信息请关注PHP中文网其他相关文章!