Comment fusionner des DataFrames en fonction de leurs indices ?

Patricia Arquette
Libérer: 2024-10-31 15:48:02
original
382 Les gens l'ont consulté

How to Merge DataFrames Based on Their Indices?

Fusion de dataframes par index

Introduction

La fusion de dataframes est une tâche courante dans l'analyse de données pour combiner des informations provenant de plusieurs sources. En règle générale, la fusion est effectuée en utilisant des colonnes comme critères de correspondance. Cependant, il existe des cas où vous devrez peut-être fusionner des trames de données en fonction de leurs indices. Cet article fournit des conseils sur la façon d'y parvenir.

Fusion de trames de données par index à l'aide de méthodes de jointure

Pour fusionner des trames de données par index, vous pouvez utiliser les méthodes de jointure suivantes :

  • fusionner : Effectuer une jointure interne par défaut.
<code class="python">pd.merge(df1, df2, left_index=True, right_index=True)</code>
Copier après la connexion
  • joindre : Effectuer une jointure gauche par défaut.
<code class="python">df1.join(df2)</code>
Copier après la connexion
  • concat : Effectuer une jointure externe par défaut.
<code class="python">pd.concat([df1, df2], axis=1)</code>
Copier après la connexion

Exemples

Considérez les dataframes suivantes :

<code class="python">df1 = pd.DataFrame({'a':range(6), 'b':[5,3,6,9,2,4]}, index=list('abcdef'))
df2 = pd.DataFrame({'c':range(4), 'd':[10,20,30, 40]}, index=list('abhi'))</code>
Copier après la connexion

Jointure interne par défaut :

<code class="python">df3 = pd.merge(df1, df2, left_index=True, right_index=True)</code>
Copier après la connexion

Sortie :

   a  b  c   d
a  0  5  0  10
b  1  3  1  20
Copier après la connexion

Jointure gauche par défaut :

<code class="python">df4 = df1.join(df2)</code>
Copier après la connexion

Sortie :

   a  b    c     d
a  0  5  0.0  10.0
b  1  3  1.0  20.0
c  2  6  NaN   NaN
d  3  9  NaN   NaN
e  4  2  NaN   NaN
f  5  4  NaN   NaN
Copier après la connexion

Jointure externe par défaut :

<code class="python">df5 = pd.concat([df1, df2], axis=1)</code>
Copier après la connexion

Sortie :

     a    b    c     d
a  0.0  5.0  0.0  10.0
b  1.0  3.0  1.0  20.0
c  2.0  6.0  NaN   NaN
d  3.0  9.0  NaN   NaN
e  4.0  2.0  NaN   NaN
f  5.0  4.0  NaN   NaN
h  NaN  NaN  2.0  30.0
i  NaN  NaN  3.0  40.0
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!