ホームページ > バックエンド開発 > Python チュートリアル > データフレーム列の個別の値に基づいて行を抽出する方法

データフレーム列の個別の値に基づいて行を抽出する方法

Mary-Kate Olsen
リリース: 2024-11-04 10:41:30
オリジナル
607 人が閲覧しました

How to Extract Rows Based on Distinct Values in a Dataframe Column?

データフレーム列内の個別の値のクエリ

データフレームを操作する場合、多くの場合、データフレーム列内の個別の値に基づいて行を取得する必要があります。特定の列。これにより、重複する値を削除し、一意のデータ ポイントのセットを取得できます。

次のデータフレームを考えてみましょう:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45
ログイン後にコピー

列の一意の値に対応する行を抽出するとします。コル2。これを実現するには、pandas のdrop_duplicates 関数を利用します。この関数は列名を引数として受け取り、データフレームから重複行を削除します。

<code class="python">import pandas as pd

df = pd.DataFrame(...)  # assuming the given dataframe
df = df.drop_duplicates('COL2')</code>
ログイン後にコピー

デフォルトでは、drop_duplicates は各一意の値の最初の出現を保持します。あるいは、keep='last' を指定して最後の出現を保持するか、keep=False を指定して重複する行をすべて削除することもできます。

<code class="python"># Keep first occurrence
df = df.drop_duplicates('COL2', keep='first')

# Keep last occurrence
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicates
df = df.drop_duplicates('COL2', keep=False')</code>
ログイン後にコピー

上記のコマンドのいずれかを実行すると、データフレーム df には行のみが含まれます。 COL2 列の個別の値に対応:

    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56
ログイン後にコピー

以上がデータフレーム列の個別の値に基づいて行を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート