首页 > 后端开发 > Python教程 > 如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?

如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?

Mary-Kate Olsen
发布: 2024-11-08 09:46:02
原创
1049 人浏览过

How to Remove Duplicates in Column A While Keeping the Row with the Highest Value in Column B?

删除 A 列中的重复项时保留具有最高 B 值的行

当前的任务涉及删除 A 列中的重复值一个数据框,同时保留 B 列中具有最高值的行。为了实现这一点,我们可以利用 Python 的 Pandas 中的内置函数库。

一种方法是按 A 列对数据帧进行排序,然后丢弃重复项,同时保留最后一次出现的值。这表示如下:

df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
登录后复制

或者,可以考虑不同标准的更灵活的解决方案是按 A 列对数据帧进行分组。在每个组中,B 列中具有最大值的行可以是提取的。这可以使用以下代码来实现:

df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
登录后复制

通过实现这两种方法之一,您可以有效消除 A 列中的重复值,同时确保保留 B 值最高的行。

以上是如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板