Heim Backend-Entwicklung Python-Tutorial Wie finde ich nach der Gruppierung den häufigsten Wert in einer Pandas-DataFrame-Spalte?

Wie finde ich nach der Gruppierung den häufigsten Wert in einer Pandas-DataFrame-Spalte?

Nov 30, 2024 pm 12:13 PM

How to Find the Most Common Value in a Pandas DataFrame Column After Grouping?

<h2>GroupBy pandas DataFrame und Select Most Common Value</h2>

Sie haben die Aufgabe, einen Datenrahmen mit drei Zeichenfolgenspalten zu bereinigen, um dies sicherzustellen Die dritte Spalte enthält den korrekten Wert für die angegebene Kombination der ersten beiden Spalten. Der von Ihnen bereitgestellte Codeausschnitt versucht, den Datenrahmen nach den ersten beiden Spalten zu gruppieren und für jede Kombination den häufigsten Wert der dritten Spalte auszuwählen. Beim Versuch, die agg-Funktion auszuführen, tritt jedoch ein Problem auf.

<h3>Using Pandas >= 0.16</h3>

Die Syntax, die Sie in Ihrem Code verwendet haben, ist veraltet . Verwenden Sie stattdessen die Funktion pd.Series.mode, die in Pandas-Versionen 0.16 und höher verfügbar ist. Diese Funktion gibt den häufigsten Wert in einer Reihe von Zeichenfolgen zurück. So wenden Sie es an:

1

source.groupby(['Country','City'])['Short name'].agg(pd.Series.mode)

Nach dem Login kopieren

Diese Syntax gruppiert den Datenrahmen nach „Land“ und „Stadt“, wendet die pd.Series.mode-Funktion auf die Spalte „Kurzname“ jeder Gruppe an und zeigt die an Ergebnisse.

Wenn Sie die Ausgabe als DataFrame benötigen, verwenden Sie dies line:

1

source.groupby(['Country','City'])['Short name'].agg(pd.Series.mode).to_frame()

Nach dem Login kopieren

<h3>Umgang mit mehreren Modi</h3>

Die pd.Series.mode-Funktion bewältigt auch effektiv Situationen, in denen mehrere Modi vorhanden sind. Wenn beispielsweise mehrere Werte mit der gleichen Häufigkeit wie der häufigste Wert auftreten, werden sie als Liste von Modi zurückgegeben.

<h3>Alternativen (nicht empfohlen)</h3>

Sie können die Funktion „statistics.mode“ aus der Python-Standardbibliothek verwenden. Dieser Ansatz funktioniert jedoch nicht gut, wenn mehrere Modi verarbeitet werden. Es löst einen StatisticsError aus, wenn es keinen einzelnen, häufigsten Wert gibt.

Das obige ist der detaillierte Inhalt vonWie finde ich nach der Gruppierung den häufigsten Wert in einer Pandas-DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Artikel -Tags

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden Mar 05, 2025 am 09:58 AM

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden

So herunterladen Sie Dateien in Python So herunterladen Sie Dateien in Python Mar 01, 2025 am 10:03 AM

So herunterladen Sie Dateien in Python

Wie benutze ich eine schöne Suppe, um HTML zu analysieren? Wie benutze ich eine schöne Suppe, um HTML zu analysieren? Mar 10, 2025 pm 06:54 PM

Wie benutze ich eine schöne Suppe, um HTML zu analysieren?

Bildfilterung in Python Bildfilterung in Python Mar 03, 2025 am 09:44 AM

Bildfilterung in Python

Wie man mit PDF -Dokumenten mit Python arbeitet Wie man mit PDF -Dokumenten mit Python arbeitet Mar 02, 2025 am 09:54 AM

Wie man mit PDF -Dokumenten mit Python arbeitet

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen Wie kann man mit Redis in Django -Anwendungen zwischenstrichen Mar 02, 2025 am 10:10 AM

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen

Einführung des natürlichen Sprach -Toolkits (NLTK) Einführung des natürlichen Sprach -Toolkits (NLTK) Mar 01, 2025 am 10:05 AM

Einführung des natürlichen Sprach -Toolkits (NLTK)

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch? Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch? Mar 10, 2025 pm 06:52 PM

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch?

See all articles