Die pandas.concat ()-Funktion ist ein vielseitiges Tool zum Kombinieren mehrerer Serien- oder DataFrame-Objekte in einem einzigen, konsolidierten DataFrame. Es bietet mehrere Argumente zum Anpassen des Verkettungsprozesses, einschließlich der Ebenen-, Schlüssel- und Namensargumente. Dieser Leitfaden bietet eine umfassende Erklärung dieser Argumente mit Beispielen zur Veranschaulichung ihrer Verwendung.
Die Syntax für die pandas.concat()-Funktion lautet wie folgt:
<code class="python">pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)</code>
Der folgende Codeausschnitt zeigt ein einfaches Beispiel für die Verkettung zweier DataFrames entlang der Indexachse:
<code class="python">import pandas as pd df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]}) df = pd.concat([df1, df2]) print(df)</code>
Ausgabe:
A B 0 1 4 1 2 5 2 3 6 3 7 10 4 8 11 5 9 12
Mit dem Schlüsselargument können Sie eine Liste von Skalarwerten oder Tupeln angeben, um eine MultiIndex-Struktur im resultierenden DataFrame zu erstellen. Jedes Element in der Schlüsselliste entspricht einem der zu verkettenden Objekte.
Betrachten Sie beispielsweise den folgenden Codeausschnitt:
<code class="python">keys = ['df1', 'df2'] df = pd.concat([df1, df2], keys=keys) print(df)</code>
Ausgabe:
A B df1 0 1 4 1 2 5 2 3 6 df2 3 7 10 4 8 11 5 9 12
Das Argument „keys“ erstellt eine neue Ebene im Index mit dem Namen „keys“. Dadurch können Sie leicht erkennen, welche Zeilen zu welchem DataFrame gehören.
Das Ebenenargument wird verwendet, um die spezifischen Ebenen des zu verwendenden MultiIndex anzugeben. Es wird eine Liste von Sequenzen erwartet, wobei jede Sequenz eine Ebene im MultiIndex darstellt.
Zum Beispiel gibt der folgende Code an, dass der MultiIndex zwei Ebenen haben soll:
<code class="python">levels = [['df1', 'df2'], ['A', 'B']] df = pd.concat([df1, df2], keys=keys, levels=levels) print(df)</code>
Ausgabe:
A B df1 A 0 1 4 B 1 2 5 C 2 3 6 df2 A 3 7 10 B 4 8 11 C 5 9 12
Das Argument „levels“ bietet Flexibilität bei der Erstellung komplexerer MultiIndex-Strukturen.
Mit dem Argument „names“ können Sie benutzerdefinierte Namen für die Ebenen des MultiIndex angeben. Es erwartet eine Liste von Zeichenfolgen, wobei jede Zeichenfolge den Namen einer Ebene darstellt.
<code class="python">names = ['DataFrame', 'Column'] df = pd.concat([df1, df2], keys=keys, levels=levels, names=names) print(df)</code>
Ausgabe:
DataFrame Column A B df1 A 0 1 4 B 1 2 5 C 2 3 6 df2 A 3 7 10 B 4 8 11 C 5 9 12
Das Namensargument hilft, Kontext bereitzustellen und die Lesbarkeit beim Umgang mit MultiIndex-Strukturen zu verbessern .
Die Ebenen-, Schlüssel- und Namensargumente sind leistungsstarke Werkzeuge zum Anpassen des Verkettungsprozesses in Pandas. Sie ermöglichen Ihnen die Erstellung flexibler und informativer MultiIndex-Strukturen, die die Datenanalyse und -manipulation erleichtern. Wenn Sie die Verwendung dieser Argumente verstehen, können Sie Ihre Pandas-Programmierkenntnisse verbessern und Ihre Daten effektiv verwalten.
Das obige ist der detaillierte Inhalt vonWie helfen die Argumente „levels', „keys' und „names' in der „concat'-Funktion von Pandas beim Erstellen und Anpassen von MultiIndex-Strukturen in DataFrames?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!