Bedingte Spalten basierend auf vorhandenen Spaltenwerten erstellen
Bei der Datenanalyse ist es oft notwendig, neue Spalten zu erstellen, deren Werte basierend auf Bedingungen bestimmt werden abgeleitet von vorhandenen Spalten. Stellen Sie sich das Szenario vor, in dem Sie einen DataFrame mit zwei Spalten haben: „Typ“ und „Set“ und Sie eine neue Spalte namens „Farbe“ hinzufügen möchten, die bestimmten Regeln folgt.
Hinzufügen einer Farbspalte Basierend auf festgelegten Werten
Um eine „Farb“-Spalte zu erstellen, in der die Werte „grün“ sind, wenn „Set“ „Z“ ist, und andernfalls „rot“, können Sie Folgendes verwenden Ansatz:
import numpy as np df['color'] = np.where(df['Set'] == 'Z', 'green', 'red')
Dieser Code verwendet die Funktion np.where, die Werte basierend auf einer Bedingung auswählt. Wenn der Wert der Spalte „Set“ „Z“ ist, wird der Wert „Farbe“ zu „grün“; andernfalls wird es „rot“.
Verwenden von np.select für komplexere Bedingungen
Für komplexere Szenarien, in denen Sie mehrere Bedingungen haben, können Sie np.select verwenden . Angenommen, Sie möchten Farben gemäß den folgenden Regeln zuweisen:
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
Die np.select-Funktion benötigt eine Liste von Bedingungen und eine entsprechende Liste von Auswahlmöglichkeiten. Wenn die Bedingung erfüllt ist, wird die zugehörige Auswahl ausgewählt; andernfalls wird der Standardwert verwendet.
Diese Methoden bieten vielseitige Optionen zum Erstellen bedingter Spalten basierend auf vorhandenen Spaltenwerten, sodass Sie Ihre Daten effizient bearbeiten und analysieren können.
Das obige ist der detaillierte Inhalt vonWie kann ich bedingte Spalten in einem DataFrame basierend auf vorhandenen Spaltenwerten erstellen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!