Heim Backend-Entwicklung Python-Tutorial Wie füllt man fehlende Werte in Pandas mit dem Gruppenmittelwert?

Wie füllt man fehlende Werte in Pandas mit dem Gruppenmittelwert?

Dec 11, 2024 pm 12:58 PM

How to Fill Missing Values in Pandas with the Group Mean?

Füllen fehlender Werte nach Mittelwert in jeder Gruppe in Pandas

In diesem Zusammenhang besteht Ihr Ziel darin, fehlende Werte ("NaN" ) mit dem Mittelwert für jede einzelne Gruppe in der Spalte „Name“. Um dies zu erreichen, können Sie die Transformationsfunktion von Pandas in Verbindung mit der Fillna-Methode verwenden.

Betrachten wir den bereitgestellten Beispiel-DataFrame:

df = pd.DataFrame({
    'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3],
    'name': ['A','A', 'B','B','B','B', 'C','C','C']
})

# Original DataFrame
print(df)
Nach dem Login kopieren

Um den Mittelwert innerhalb jedes „Namens“ zu berechnen Group können Sie die Groupby-Funktion verwenden:

grouped = df.groupby('name').mean()
Nach dem Login kopieren

Gruppiert ist jedoch ein DataFrame, der die Mittelwerte enthält, und wir müssen ihn wieder auf die Gruppe anwenden Original-DataFrame, um die fehlenden Werte auszufüllen. Hier wird die Transformation nützlich:

df["value"] = df.groupby("name").transform(lambda x: x.fillna(x.mean()))
Nach dem Login kopieren

Hier ist eine Aufschlüsselung des Codes:

  • df.groupby("name") gruppiert den DataFrame nach der Spalte „Name“.
  • lambda x: x.fillna(x.mean()) definiert eine anonyme Funktion, die jede Gruppe übernimmt (dargestellt durch x) als Eingabe und führt die folgende Operation aus:

    • Es füllt fehlende Werte („NaN“) mit dem mit x.mean() berechneten Mittelwert auf.
  • df["value"] ersetzt die Spalte „value“ im ursprünglichen DataFrame durch die transformierten Werte, die die fehlenden Werte auffüllen.

Danach Wenn Sie den Code ausführen, enthält der resultierende DataFrame die ausgefüllten Werte wie gewünscht:

# Adjusted DataFrame
print(df)
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie füllt man fehlende Werte in Pandas mit dem Gruppenmittelwert?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße Artikel -Tags

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie benutze ich eine schöne Suppe, um HTML zu analysieren? Wie benutze ich eine schöne Suppe, um HTML zu analysieren? Mar 10, 2025 pm 06:54 PM

Wie benutze ich eine schöne Suppe, um HTML zu analysieren?

Bildfilterung in Python Bildfilterung in Python Mar 03, 2025 am 09:44 AM

Bildfilterung in Python

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden Mar 05, 2025 am 09:58 AM

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden

Wie man mit PDF -Dokumenten mit Python arbeitet Wie man mit PDF -Dokumenten mit Python arbeitet Mar 02, 2025 am 09:54 AM

Wie man mit PDF -Dokumenten mit Python arbeitet

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen Wie kann man mit Redis in Django -Anwendungen zwischenstrichen Mar 02, 2025 am 10:10 AM

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch? Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch? Mar 10, 2025 pm 06:52 PM

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch?

So implementieren Sie Ihre eigene Datenstruktur in Python So implementieren Sie Ihre eigene Datenstruktur in Python Mar 03, 2025 am 09:28 AM

So implementieren Sie Ihre eigene Datenstruktur in Python

Serialisierung und Deserialisierung von Python -Objekten: Teil 1 Serialisierung und Deserialisierung von Python -Objekten: Teil 1 Mar 08, 2025 am 09:39 AM

Serialisierung und Deserialisierung von Python -Objekten: Teil 1

See all articles