在 Pandas DataFrames 中复制 SQL 的 DENSE_RANK()
Pandas 提供了一种模仿 SQL 的 DENSE_RANK()
函数的简单方法,即使遇到绑定值,它也会无间隙地分配排名。 这对于需要连续排名分配(无论是否重复)的场景至关重要。
利用 Pandas rank()
方法
核心解决方案在于Pandas的rank()
方法。通过指定 method='dense'
参数,我们实现了所需的密集排名行为。
示例:
让我们考虑一个示例 DataFrame:
<code class="language-python">import pandas as pd data = {'Year': [2012, 2013, 2013, 2014], 'Value': [10, 20, 25, 30]} df = pd.DataFrame(data)</code>
要生成“Rank”列镜像DENSE_RANK()
,请使用以下代码:
<code class="language-python">df['Rank'] = df['Year'].rank(method='dense').astype(int) print(df)</code>
这会产生以下输出:
<code> Year Value Rank 0 2012 10 1 1 2013 20 2 2 2013 25 2 3 2014 30 3</code>
请注意并列的“年份”值 (2013) 如何获得相同的排名 (2),从而保持密集的排名序列。 .astype(int)
将排名转换为整数数据类型,以便更清晰地表示。
以上是如何在 Pandas 中复制 SQL 的 DENSE_RANK() 函数?的详细内容。更多信息请关注PHP中文网其他相关文章!