Heim > Backend-Entwicklung > Python-Tutorial > Wie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?

Wie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?

DDD
Freigeben: 2024-12-01 21:07:11
Original
584 Leute haben es durchsucht

How to Select Pandas DataFrame Rows Based on Complex Multi-Column Criteria?

Auswahl mit komplexen Kriterien aus pandas.DataFrame

Bei der Datenanalyse mit Pandas müssen wir oft bestimmte Zeilen oder Spalten basierend auf komplexen Kriterien auswählen Kriterien. Diese Frage zeigt, wie Werte aus Spalte „A“ ausgewählt werden, vorausgesetzt, die entsprechenden Werte für „B“ und „C“ erfüllen bestimmte Bedingungen.

Um das Problem zu verstehen, erstellen wir einen Beispiel-DataFrame:

import pandas as pd
from random import randint

df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)],
                   'B': [randint(1, 9)*10 for x in range(10)],
                   'C': [randint(1, 9)*100 for x in range(10)]})
Nach dem Login kopieren

Jetzt wollen wir Werte aus „A“ auswählen, die die folgenden Bedingungen erfüllen:

  • Der entsprechende Wert für „B“ sollte größer sein als 50.
  • Der entsprechende Wert für „C“ sollte nicht gleich 900 sein.

Um dieses Problem zu lösen, können wir die Spaltenoperationen von Pandas verwenden:

df["B"] > 50
Nach dem Login kopieren

Dadurch wird ein boolesches Serienobjekt erstellt, bei dem jedes Element einer Zeile in „B“ entspricht und angibt, ob der jeweilige „B“-Wert größer als ist 50.

(df["B"] > 50) & (df["C"] != 900)
Nach dem Login kopieren

Dies nutzt Broadcasting und logische Operatoren, um die booleschen Serienobjekte zu kombinieren und so eine neue Serie zu erstellen, in der jedes Element angibt, ob die entsprechende Zeile beide Bedingungen erfüllt.

Verwenden dieser Serie als Als Index können wir die „A“-Werte extrahieren:

df["A"][(df["B"] > 50) & (df["C"] != 900)]
Nach dem Login kopieren

Alternativ können wir .loc verwenden Syntax:

df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]
Nach dem Login kopieren

Dieser Ansatz extrahiert effizient Zeilen, die die angegebenen Kriterien erfüllen, und ermöglicht so weitere Analysen oder Operationen an den ausgewählten Daten.

Das obige ist der detaillierte Inhalt vonWie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage