在 Pandas DataFrames 複製 SQL 的 DENSE_RANK()
Pandas 提供了一種模仿 SQL 的 DENSE_RANK()
函數的簡單方法,即使遇到綁定值,它也會無間隙地分配排名。 這對於需要連續排名分配(無論是否重複)的場景至關重要。
利用 Pandas rank()
方法
核心解決方案在於Pandas的rank()
方法。透過指定 method='dense'
參數,我們實現了所需的密集排名行為。
範例:
讓我們考慮一個範例 DataFrame:
<code class="language-python">import pandas as pd data = {'Year': [2012, 2013, 2013, 2014], 'Value': [10, 20, 25, 30]} df = pd.DataFrame(data)</code>
要產生「Rank」列鏡像DENSE_RANK()
,請使用以下程式碼:
<code class="language-python">df['Rank'] = df['Year'].rank(method='dense').astype(int) print(df)</code>
這會產生以下輸出:
<code> Year Value Rank 0 2012 10 1 1 2013 20 2 2 2013 25 2 3 2014 30 3</code>
請注意並列的「年份」值 (2013) 如何獲得相同的排名 (2),從而保持密集的排名序列。 .astype(int)
將排名轉換為整數資料類型,以便更清晰地表示。
以上是如何在 Pandas 複製 SQL 的 DENSE_RANK() 函數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!