Normalisierte Spalten: Werte im Bereich halten
Bei der Datenanalyse liegen Werte oft innerhalb eines Bereichs, was die Interpretation etwas erschwert schwierig. Die Normalisierung hilft, indem sie die Werte in eine konsistente Skala zwischen 0 und 1 umwandelt.
Betrachten wir einen Beispieldatenrahmen:
df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09
Lösung 1: Mittelwertnormalisierung
Mit Pandas können wir Spalten normalisieren, indem wir die Abweichung vom Mittelwert berechnen und sie mit der Standardabweichung standardisieren:
normalized_df = (df - df.mean()) / df.std()
Das ergibt:
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
Lösung 2: Min-Max-Normalisierung
Alternativ können wir eine Min-Max-Normalisierung durchführen, die Werte basierend auf dem Minimum und Maximum der Daten skaliert:
normalized_df = (df - df.min()) / (df.max() - df.min())
Ergebnis in:
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
Beachten Sie, dass Pandas die Normalisierung automatisch spaltenweise anwendet, was den Prozess effizient und unkompliziert macht.
Das obige ist der detaillierte Inhalt vonWie können Datenwerte mithilfe der Normalisierung innerhalb des Bereichs gehalten werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!