删除 A 列中的重复项时保留具有最高 B 值的行
当前的任务涉及删除 A 列中的重复值一个数据框,同时保留 B 列中具有最高值的行。为了实现这一点,我们可以利用 Python 的 Pandas 中的内置函数库。
一种方法是按 A 列对数据帧进行排序,然后丢弃重复项,同时保留最后一次出现的值。这表示如下:
df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
或者,可以考虑不同标准的更灵活的解决方案是按 A 列对数据帧进行分组。在每个组中,B 列中具有最大值的行可以是提取的。这可以使用以下代码来实现:
df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
通过实现这两种方法之一,您可以有效消除 A 列中的重复值,同时确保保留 B 值最高的行。
以上是如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!