Pandas GroupBy 和高效选择具有最小列值的行
使用 Pandas DataFrame 时,根据特定列值选择行是常见的任务。在需要提取特定列中具有最小值的行的情况下,有一种简单而有效的方法可以实现此目的。
为了说明这一点,请考虑以下 DataFrame:
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2], 'B': [4, 5, 2, 7, 4, 6], 'C': [3, 4, 10, 2, 4, 6]})
要为 A 的每个值选择 B 列中最小值的行,我们可以使用 groupby 和 idxmin 方法:
minimum_rows = df.loc[df.groupby('A').B.idxmin()]
此操作按 A 列对 DataFrame 进行分组并标识该行的索引B 列中每组的最小值。然后 loc 方法提取这些行以创建minimum_rows DataFrame。
A B C 2 1 2 10 4 2 4 4
如果您希望重置索引以确保连续的整数,可以使用reset_index方法:
minimum_rows.reset_index(drop=True) A B C 0 1 2 10 1 2 4 4
通过利用 groupby 和 idxmin 方法,您可以有效地选择指定列中具有最小值的行,而不需要 MultiIndex 或复杂的操作。
以上是如何在 Pandas DataFrame 中有效地选择具有最小列值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!