![How Do Different Pandas `merge()` Join Types Combine DataFrames?](https://img.php.cn/upload/article/000/000/000/173529259468456.jpg)
Pandas のマージ 101: 基本
はじめに
Pandas の DataFrame のマージは、データの結合と操作のための強力なツールですさまざまな情報源から。このガイドでは、結合の基本的な種類とその応用について包括的に概要を説明します。
結合の種類
1. INNER JOIN (デフォルト)
- 両方の DataFrame で共通のキーを持つ行を照合します。
- 両方の値が一致する行のみを返しますフレーム。
-
例:
left.merge(right, on='key')
ログイン後にコピー
2. LEFT OUTER JOIN
- 左側の DataFrame の行を右側の DataFrame の対応する行と照合します。
- 一致する行が見つからない場合、NaN が出力に挿入されます。右からの列がありませんDataFrame.
-
例:
left.merge(right, on='key', how='left')
ログイン後にコピー
3. RIGHT OUTER JOIN
- 右側の DataFrame の行を、左側の DataFrame の対応する行と照合します。
- 一致する行が見つからない場合、NaN が出力に挿入されます。左からの列がありませんDataFrame.
-
例:
left.merge(right, on='key', how='right')
ログイン後にコピー
4. FULL OUTER JOIN
- 共通のキーがあるかどうかに関係なく、両方の DataFrame のすべての行と一致します。
- 両方の欠落行には NaN が挿入されます。フレーム。
-
例:
left.merge(right, on='key', how='outer')
ログイン後にコピー
その他の結合バリエーション
1. LEFT 除外 JOIN
- 右の DataFrame のどの行にも一致しない行を、左の DataFrame から返します。
2. RIGHT 除外 JOIN
- 左の DataFrame のどの行にも一致しない行を右の DataFrame から返します。
3. ANTI JOIN (どちらかの側を除く)
- 反対側のどの行にも一致しない行を両方の DataFrame から返します。
異なる処理キー列名
- left_on とright_on 引数を使用して、異なる名前の列をマージします。
出力での重複キー列の回避
- マージの準備ステップとしてインデックスを設定しますインデックスを作成し、重複キーを削除しますcolumn.
1 つの DataFrame からの 1 つの列をマージ
- いずれかの DataFrame から特定の列を選択するためにマージする前に列をサブセット化します。
- 列が 1 つだけある場合は、より効率的なアプローチとしてマップを使用します。
複数の列で結合
- 複数の列を結合するには、on (または left_on と right_on) のリストを指定します。
以上がさまざまなパンダの「merge()」結合タイプはどのようにしてデータフレームを結合しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。