Auswahl mit komplexen Kriterien aus pandas.DataFrame
Bei der Datenanalyse mit Pandas müssen wir oft bestimmte Zeilen oder Spalten basierend auf komplexen Kriterien auswählen Kriterien. Diese Frage zeigt, wie Werte aus Spalte „A“ ausgewählt werden, vorausgesetzt, die entsprechenden Werte für „B“ und „C“ erfüllen bestimmte Bedingungen.
Um das Problem zu verstehen, erstellen wir einen Beispiel-DataFrame:
import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)], 'B': [randint(1, 9)*10 for x in range(10)], 'C': [randint(1, 9)*100 for x in range(10)]})
Jetzt wollen wir Werte aus „A“ auswählen, die die folgenden Bedingungen erfüllen:
Um dieses Problem zu lösen, können wir die Spaltenoperationen von Pandas verwenden:
df["B"] > 50
Dadurch wird ein boolesches Serienobjekt erstellt, bei dem jedes Element einer Zeile in „B“ entspricht und angibt, ob der jeweilige „B“-Wert größer als ist 50.
(df["B"] > 50) & (df["C"] != 900)
Dies nutzt Broadcasting und logische Operatoren, um die booleschen Serienobjekte zu kombinieren und so eine neue Serie zu erstellen, in der jedes Element angibt, ob die entsprechende Zeile beide Bedingungen erfüllt.
Verwenden dieser Serie als Als Index können wir die „A“-Werte extrahieren:
df["A"][(df["B"] > 50) & (df["C"] != 900)]
Alternativ können wir .loc verwenden Syntax:
df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]
Dieser Ansatz extrahiert effizient Zeilen, die die angegebenen Kriterien erfüllen, und ermöglicht so weitere Analysen oder Operationen an den ausgewählten Daten.
Das obige ist der detaillierte Inhalt vonWie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!