Normalisierung von Spalten eines Datenrahmens
Beim Arbeiten mit Datenrahmen, die Spalten mit unterschiedlichen Wertebereichen enthalten, kann die Normalisierung die Datenwerte innerhalb einer konsistenten Skala ausrichten , was den Vergleich und die Analyse erleichtert. In diesem Fall besteht das Ziel darin, die Spalten eines Datenrahmens zu normalisieren und jeden Wert so umzuwandeln, dass er zwischen 0 und 1 liegt.
Um dies zu erreichen, ist ein praktischer Ansatz die Verwendung der Pandas-Bibliothek. Durch die Nutzung spaltenweiser Operationen ermöglicht Pandas eine effiziente Normalisierung:
Mittelwertnormalisierung:
<code class="python">import pandas as pd # Create a dataframe with varying column ranges df = pd.DataFrame({ 'A': [1000, 765, 800], 'B': [10, 5, 7], 'C': [0.5, 0.35, 0.09] }) # Normalize using mean normalization normalized_df = (df - df.mean()) / df.std() # Display normalized dataframe print(normalized_df)</code>
Ausgabe:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
Min-Max-Normalisierung:
<code class="python"># Normalize using min-max normalization normalized_df = (df - df.min()) / (df.max() - df.min()) # Display normalized dataframe print(normalized_df)</code>
Ausgabe:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
Sowohl Mittelwert- als auch Min-Max-Normalisierungstechniken stellen sicher dass die Werte jeder Spalte im Bereich [0, 1] liegen, was den Datenvergleich und die Datenanalyse erleichtert. Durch die Nutzung der spaltenweisen Operationen von Pandas können diese Normalisierungen effizient durchgeführt werden.
Das obige ist der detaillierte Inhalt vonWie normalisiere ich Spalten eines Datenrahmens in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!