La fusion de DataFrames dans Pandas implique de combiner deux ou plusieurs DataFrames en fonction de colonnes clés communes. Il existe plusieurs types de jointures, notamment :
INNER JOIN : Renvoie uniquement les lignes dont les clés correspondent dans les deux DataFrames.
LEFT JOIN : Inclut toutes les lignes du DataFrame de gauche et les lignes correspondantes du DataFrame de droite. Les valeurs manquantes à droite sont remplies de NaN.
RIGHT JOIN : Inclut toutes les lignes du DataFrame de droite et les lignes correspondantes du DataFrame de gauche. Les valeurs manquantes à gauche sont remplies de NaN.
FULL OUTER JOIN : Inclut toutes les lignes des deux DataFrames, en remplissant les valeurs manquantes avec NaNs.
Si les colonnes clés ont des noms différents, utilisez left_on et right_on arguments :
Lors de la fusion sur différentes colonnes clés, définissez l'index au préalable étape :
Rejoignez plusieurs colonnes en passant une liste à on (ou left_on et right_on):
Pour fusionner plusieurs DataFrames, utilisez pd.merge_asof pour des jointures approximatives ou pd.merge_ordered pour des jointures ordonnées rejoint.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!