Wie ersetze ich fehlende Werte in Pandas-DataFrames durch Spaltendurchschnitte?

Barbara Streisand
Freigeben: 2024-10-28 18:33:02
Original
972 Leute haben es durchsucht

How to Replace Missing Values in Pandas DataFrames with Column Averages?

Ersetzen von NaN-Werten durch Spaltendurchschnitte in Pandas-DataFrames

Bei der Arbeit mit Pandas-DataFrames kommt es häufig vor, dass NaN-Werte (fehlende Werte) auftreten. Um mit diesen Werten effektiv umgehen zu können, ist es wichtig, sie durch geeignete Werte zu ersetzen. Eine effiziente Möglichkeit besteht darin, NaN-Werte durch den Durchschnitt ihrer jeweiligen Spalten zu ersetzen.

Lösung mit DataFrame.fillna

Im Gegensatz zu dem in der Referenzfrage erwähnten Ansatz verwendet Pandas DataFrames kann unterschiedlich gehandhabt werden. Die DataFrame.fillna-Methode bietet eine einfache Lösung zum Füllen von NaN-Werten:

<code class="python">df.fillna(df.mean())</code>
Nach dem Login kopieren

Detaillierte Erklärung:

  • Die Funktion df.mean() berechnet die Durchschnitt jeder Spalte im DataFrame.
  • Die Fillna-Methode verwendet die berechneten Durchschnittswerte und füllt die NaN-Werte in jeder Spalte mit dem entsprechenden Durchschnitt.

Beispiel:

Betrachten wir den folgenden DataFrame:

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3       NaN -2.027325  1.533582
4       NaN       NaN  0.461821
5 -0.788073       NaN       NaN
6 -0.916080 -0.612343       NaN
7 -0.887858  1.033826       NaN
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431
Nach dem Login kopieren

Nach Anwendung der Fillna-Methode mit Durchschnittswerten:

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3 -0.151121 -2.027325  1.533582
4 -0.151121 -0.231291  0.461821
5 -0.788073 -0.231291 -0.530307
6 -0.916080 -0.612343 -0.530307
7 -0.887858  1.033826 -0.530307
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431
Nach dem Login kopieren

Wie gezeigt, wurden die NaN-Werte durch ersetzt entsprechende Spaltendurchschnitte.

Das obige ist der detaillierte Inhalt vonWie ersetze ich fehlende Werte in Pandas-DataFrames durch Spaltendurchschnitte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!