Ersetzen von Leerwerten durch NaN in Pandas
In Pandas-Datenrahmen ist es häufig erforderlich, Leerzeichenwerte (" ") zu identifizieren und durch zu ersetzen NaN-Werte. Dieser Vorgang stellt die Datenintegrität sicher und ermöglicht eine nahtlose Analyse.
Eine effiziente Möglichkeit, dies zu erreichen, ist die Pandas-Methode replace(). Seine Syntax lautet wie folgt:
<code class="python">df.replace(to_replace, value, regex=True)</code>
In diesem Zusammenhang:
Leerwerte können durch NaN ersetzt werden Verwenden Sie den folgenden Code:
<code class="python">import pandas as pd import numpy as np # Create a sample dataframe df = pd.DataFrame({ "A": [-0.532681, 1.490752, -1.387326, 0.814772, -0.222552, -1.176781], "B": ['foo', 'bar', 'foo', 'baz', ' ','qux'], "C": [0, 1, 2, ' ', 4, ' '] }) # Replace blank values with NaN df = df.replace(r'^\s*$', np.nan, regex=True) # Display the updated dataframe print(df)</code>
Ausgabe:
A B C 0 -0.532681 foo 0 1 1.490752 bar 1 2 -1.387326 foo 2 3 0.814772 baz NaN 4 -0.222552 NaN 4 5 -1.176781 qux NaN
Dieser Code ersetzt effektiv alle leeren Werte im Datenrahmen durch NaN und sorgt so für eine sauberere und genauere Darstellung Ihrer Daten.
Das obige ist der detaillierte Inhalt vonWie ersetze ich leere Werte durch NaN in Pandas DataFrames?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!