删除 Pandas 中的连续重复项
要从 pandas 系列中删除连续的重复项,可以使用多种方法。
方法一:使用Shift
最有效的方法是利用 shift() 函数:
a.loc[a.shift() != a]
此方法将 Series 与其自己的移位版本进行比较,创建一个布尔掩码,其中连续的重复项
方法2:使用Diff
另一种方法是使用 diff() 函数:
a.loc[a.diff() != 0]
但是,这种方法对于大型数据集来说稍微慢一些。
更新:
需要注意的是,使用默认周期为1 相当于shift(1)。因此,以下代码也会产生所需的输出:
a.loc[a.shift(1) != a]
通过利用这些方法,您可以有效地从 pandas Series 中删除连续的重复项,确保只保留不同的值。
以上是如何删除 Pandas 系列中的连续重复项?的详细内容。更多信息请关注PHP中文网其他相关文章!