Pandas iterrows 的性能问题
iterrows 是一个用于逐行迭代的 pandas 函数,已被观察到表现出性能缺陷。虽然该问题可能与数据帧中的混合数据类型有关,但即使没有此问题的简单场景也会表现出显着的性能滞后。
向量化操作(例如 apply)通常优于 iterrows,引发了关于是否需要 row-by 的问题-行迭代。然而,在某些情况下,iterrows 仍然是不可避免的。
Iterrows 性能问题的原因
通常,由于性能特征,iterrows 的效率低于矢量化、apply 和 itertuples :
最佳性能指南
要优化性能,请考虑以下指南:
以上是为什么 Pandas `iterrows` 这么慢,如何提高性能?的详细内容。更多信息请关注PHP中文网其他相关文章!