Maison > développement back-end > Tutoriel Python > Comment effectuer différents types de jointures et gérer les données manquantes dans Pandas ?

Comment effectuer différents types de jointures et gérer les données manquantes dans Pandas ?

Barbara Streisand
Libérer: 2024-12-30 10:23:08
original
464 Les gens l'ont consulté

How to Perform Different Types of Joins and Handle Missing Data in Pandas?

Pandas fusionnant 101

Bases de la fusion - Types de base de jointures

Comment pour effectuer un (INNER| (LEFT|RIGHT|FULL) OUTER) JOIN avec pandas ?

Pour effectuer une opération de fusion, utilisez la méthode de fusion sur un DataFrame. Spécifiez l'autre DataFrame et les clés de fusion comme arguments. Les différents types de jointures sont :

  • INNER JOIN : Joint les lignes qui partagent les mêmes valeurs dans la clé de fusion.
  • LEFT OUTER JOIN : conserve toutes les lignes du DataFrame de gauche et insère les valeurs manquantes pour les lignes de droite DataFrame.
  • RIGHT OUTER JOIN : conserve toutes les lignes du DataFrame droit et insère les valeurs manquantes pour les lignes du DataFrame gauche.
  • FULL OUTER JOIN : combine toutes les lignes des deux DataFrames, en insérant les valeurs manquantes pour les valeurs manquantes se chevauchent.

Comment ajouter des NaN pour les lignes manquantes après une fusion ?

Données manquantes dans le DataFrame droit après un LEFT OUTER JOIN ou dans le gauche Les DataFrame après un RIGHT OUTER JOIN sont remplacés par des NaN par défaut.

Comment puis-je me débarrasser des NaN après la fusion ?

Les NaN peuvent être supprimés à l'aide du filtrage ou en utilisant la méthode fillna() pour les remplacer par la valeur souhaitée.

Peut-on Je fusionne sur l'index ?

Oui, vous pouvez fusionner sur l'index en définissant l'index comme clé de fusion à l'aide de left_index et Paramètres right_index.

Comment fusionner plusieurs DataFrames ?

Plusieurs DataFrames peuvent être fusionnés en appelant merge plusieurs fois ou en utilisant la fonction pd.concat.

Croiser avec des pandas

Pour effectuer un croisement join, qui combine chaque ligne d'un DataFrame avec chaque ligne d'un autre, utilisez la fonction pd.merge sans spécifier de clé de fusion.

fusionner ? rejoindre? concaténer ? mise à jour? OMS? Quoi? Pourquoi ?!!

Le tableau suivant résume les différences entre ces opérations :

Fonctionnement Objectif
Operation Purpose
merge Join DataFrames based on common keys
join Alias for merge
concat Concatenate DataFrames along a specific axis
update Update one DataFrame with values from another
fusionner
Rejoindre des DataFrames basés sur des clés
rejoindre Alias ​​pour la fusion
concat Concaténer des DataFrames le long d'un axe spécifique
mettre à jour Mettre à jour un DataFrame avec des valeurs d'un autre

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal