Fusion de dataframes par index
Introduction
La fusion de dataframes est une tâche courante dans l'analyse de données pour combiner des informations provenant de plusieurs sources. En règle générale, la fusion est effectuée en utilisant des colonnes comme critères de correspondance. Cependant, il existe des cas où vous devrez peut-être fusionner des trames de données en fonction de leurs indices. Cet article fournit des conseils sur la façon d'y parvenir.
Fusion de trames de données par index à l'aide de méthodes de jointure
Pour fusionner des trames de données par index, vous pouvez utiliser les méthodes de jointure suivantes :
<code class="python">pd.merge(df1, df2, left_index=True, right_index=True)</code>
<code class="python">df1.join(df2)</code>
<code class="python">pd.concat([df1, df2], axis=1)</code>
Exemples
Considérez les dataframes suivantes :
<code class="python">df1 = pd.DataFrame({'a':range(6), 'b':[5,3,6,9,2,4]}, index=list('abcdef')) df2 = pd.DataFrame({'c':range(4), 'd':[10,20,30, 40]}, index=list('abhi'))</code>
Jointure interne par défaut :
<code class="python">df3 = pd.merge(df1, df2, left_index=True, right_index=True)</code>
Sortie :
a b c d a 0 5 0 10 b 1 3 1 20
Jointure gauche par défaut :
<code class="python">df4 = df1.join(df2)</code>
Sortie :
a b c d a 0 5 0.0 10.0 b 1 3 1.0 20.0 c 2 6 NaN NaN d 3 9 NaN NaN e 4 2 NaN NaN f 5 4 NaN NaN
Jointure externe par défaut :
<code class="python">df5 = pd.concat([df1, df2], axis=1)</code>
Sortie :
a b c d a 0.0 5.0 0.0 10.0 b 1.0 3.0 1.0 20.0 c 2.0 6.0 NaN NaN d 3.0 9.0 NaN NaN e 4.0 2.0 NaN NaN f 5.0 4.0 NaN NaN h NaN NaN 2.0 30.0 i NaN NaN 3.0 40.0
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!