パンダの密なランキング: 関連付けられた値に一意のランキングを割り当てます
データ分析では、多くの場合、順序に基づいてデータセット内の値をランク付けする必要があります。 Pandas では、rank 関数はデフォルトで序数のランキングを計算する方法を提供します。ただし、場合によっては、密なランキングを取得する必要がある場合があります。この場合、結合された値はスキップされるのではなく、同じランキングを受け取ります。
次の Pandas データ フレームについて考えてみましょう:
<code>Year Value 2012 10 2013 20 2013 25 2014 30</code>
年列の DENSE_RANK() 関数と同等の結果を生成するには、次の手順を実行します。
<code>df['Rank'] = df.Year.rank(method='dense').astype(int) print(df)</code>
これにより、Rank という名前の新しい列が生成され、各年に密なランキングが割り当てられます。
<code> Year Value Rank 0 2012 10 1 1 2013 20 2 2 2013 25 2 3 2014 30 3</code>
この例では、2013 年の同順位の値は同じランク 2 を受け取り、値がスキップされたり、誤ってランク付けされたりすることはありません。 astype(int) 変換はオプションですが、ランキングが整数として保存されるようにするために使用することをお勧めします。
以上がPandas `rank(method='dense')` はどのようにして関連付けられた値に一意のランクを割り当てるのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。