


Wie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?
Oct 25, 2024 am 08:01 AMErhalten Sie eine Häufigkeitszählung basierend auf mehreren Datenrahmenspalten
Um zu bestimmen, wie oft identische Zeilen in einem Datenrahmen erscheinen, können wir Groupby von Pandas verwenden Funktion. Betrachten Sie das folgende Beispiel:
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
Wir können die Häufigkeitsanzahl auf drei Arten berechnen:
Option 1:
dfg = df.groupby(by=["Group", "Size"]).size()
Dies ergibt eine Serie mit der folgenden Ausgabe:
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
Option 2:
dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
Dies führt zu einem DataFrame mit einer hinzugefügten Spalte „Zeit“:
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
Option 3:
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
Dies erzeugt auch einen DataFrame, der der Ausgabe von Option 2 entspricht.
Das obige ist der detaillierte Inhalt vonWie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heißer Artikel

Hot-Tools-Tags

Heißer Artikel

Heiße Artikel -Tags

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wie benutze ich eine schöne Suppe, um HTML zu analysieren?

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden

Wie man mit PDF -Dokumenten mit Python arbeitet

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch?

So implementieren Sie Ihre eigene Datenstruktur in Python

Serialisierung und Deserialisierung von Python -Objekten: Teil 1
