Datenrahmen nach Index zusammenführen
Bei der Arbeit mit Datenrahmen ist es häufig erforderlich, diese anhand passender Indizes zu kombinieren. Während Zusammenführungsvorgänge normalerweise auf Spaltenübereinstimmungen basieren, ist es möglich, Datenrahmen basierend auf ihren Indizes zusammenzuführen.
Inner Join auf Indizes
Zum Zusammenführen zweier Datenrahmen nach Index mithilfe eines Inner Join können Sie die Zusammenführungsfunktion mit den Argumenten left_index und right_index verwenden, die auf True gesetzt sind:
pd.merge(left_dataframe, right_dataframe, left_index=True, right_index=True)
Dieser Vorgang erstellt einen neuen Datenrahmen, der nur die Zeilen enthält, in denen die Indizes der beiden Datenrahmen übereinstimmen.
Beispiel:
Betrachten Sie die folgenden Datenrahmen:
df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 df2 concept 0 A 1 B
Das Zusammenführen dieser Datenrahmen nach Index würde Folgendes ergeben:
id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 421 18 false 0.0 1 B
Linker Join für Indizes
Für einen linken Join nach Index können Sie die Join-Methode für den linken Datenrahmen verwenden:
left_dataframe.join(right_dataframe, on='index')
Outer Join für Indizes
Um einen Outer-Join für Indizes durchzuführen, können Sie die Concat-Funktion verwenden, wobei das Achsenargument auf 1 gesetzt ist:
pd.concat([left_dataframe, right_dataframe], axis=1)
Überlegungen
Während es im Allgemeinen möglich ist, Datenrahmen nach Index zusammenzuführen, ist es wichtig zu beachten, dass dies zu doppelten Zeilen führen kann, wenn die Indizes nicht in beiden Datenrahmen eindeutig sind. In solchen Fällen kann es erforderlich sein, vor dem Zusammenführen zunächst sicherzustellen, dass die Indizes eindeutig sind.
Das obige ist der detaillierte Inhalt vonWie füge ich DataFrames nach Index in Python zusammen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!