Ersetzen von NaN-Werten durch Spaltendurchschnitte in Pandas-DataFrames
Bei der Arbeit mit Pandas-DataFrames kommt es häufig vor, dass NaN-Werte (fehlende Werte) auftreten. Um mit diesen Werten effektiv umgehen zu können, ist es wichtig, sie durch geeignete Werte zu ersetzen. Eine effiziente Möglichkeit besteht darin, NaN-Werte durch den Durchschnitt ihrer jeweiligen Spalten zu ersetzen.
Lösung mit DataFrame.fillna
Im Gegensatz zu dem in der Referenzfrage erwähnten Ansatz verwendet Pandas DataFrames kann unterschiedlich gehandhabt werden. Die DataFrame.fillna-Methode bietet eine einfache Lösung zum Füllen von NaN-Werten:
<code class="python">df.fillna(df.mean())</code>
Detaillierte Erklärung:
Beispiel:
Betrachten wir den folgenden DataFrame:
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 NaN -2.027325 1.533582 4 NaN NaN 0.461821 5 -0.788073 NaN NaN 6 -0.916080 -0.612343 NaN 7 -0.887858 1.033826 NaN 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
Nach Anwendung der Fillna-Methode mit Durchschnittswerten:
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 -0.151121 -2.027325 1.533582 4 -0.151121 -0.231291 0.461821 5 -0.788073 -0.231291 -0.530307 6 -0.916080 -0.612343 -0.530307 7 -0.887858 1.033826 -0.530307 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
Wie gezeigt, wurden die NaN-Werte durch ersetzt entsprechende Spaltendurchschnitte.
Das obige ist der detaillierte Inhalt vonWie ersetze ich fehlende Werte in Pandas-DataFrames durch Spaltendurchschnitte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!