個別値行の取得
列 (具体的には COL2) 内の個別の値に基づいて行を抽出するには、次のメソッドを使用できます。
Keep First を使用したdrop_duplicates:
df = df.drop_duplicates('COL2', keep='first')
これにより、COL2 内の各一意の値の最初の出現が保持されます。
Keep Last を使用したdrop_duplicates:
df = df.drop_duplicates('COL2', keep='last')
これにより、COL2 内の各一意の値の最後の出現が維持されます。
drop_duplicates with No Keep:
df = df.drop_duplicates('COL2', keep=False)
これにより、すべての重複行が削除され、COL2 に一意の値のみが生成されます。
例:
次のデータフレームを考えてみましょう:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
e.com | 45 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
keep_first メソッドを使用すると次の結果が生成されます:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
f.com | 56 |
keep_last メソッドの結果:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
最後に、keep_false メソッドを使用すると次が生成されます:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
以上がPandas DataFrame で異なる値を持つ行を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。