So teilen Sie einen Pandas DataFrame durch einen Spaltenwert
Das Teilen eines Pandas DataFrame basierend auf einem Spaltenwert kann nützlich sein, um separate Teilmengen zu erstellen von Daten. Angenommen, Sie haben einen DataFrame mit einer Spalte namens „Sales“ und möchten ihn in zwei DataFrames aufteilen: einen mit Zeilen, in denen „Sales“ kleiner als ein angegebener Wert ist, und einen anderen mit Zeilen, in denen „Sales“ größer oder gleich ist diesen Wert.
Um dies zu erreichen, können Sie die boolesche Indizierung mit den folgenden Schritten verwenden:
Datenrahmen aufteilen: Anwenden die booleschen Masken zum ursprünglichen DataFrame, um zwei neue DataFrames zu erstellen:
Alternativ können Sie die erste Maske mit dem ~-Operator umkehren:
mask = df['Sales'] >= s df1 = df[mask] df2 = df[~mask]<p>Hier ist Ein Beispiel zur Veranschaulichung des Prozesses:</p> <pre class="brush:php;toolbar:false"><code class="python">df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]}) print(df) s = 30 df1 = df[df['Sales'] >= s] print(df1) df2 = df[df['Sales'] < s] print(df2)</code>
Die Ausgabe lautet:
A Sales 0 3 10 1 4 20 2 7 30 3 6 40 4 1 50 A Sales 2 7 30 3 6 40 4 1 50 A Sales 0 3 10 1 4 20
Dies zeigt, wie ein Pandas-DataFrame basierend auf einem angegebenen Spaltenwert mithilfe einer booleschen Indizierung in zwei Teile geteilt wird.
Das obige ist der detaillierte Inhalt vonWie dividiere ich einen Pandas-DataFrame durch einen Spaltenwert?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!