Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame basierend auf mehreren Spalten zählen?

Wie kann ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame basierend auf mehreren Spalten zählen?

Susan Sarandon
Freigeben: 2024-10-25 02:03:02
Original
759 Leute haben es durchsucht

How can I count the frequency of identical rows in a pandas DataFrame based on multiple columns?

Häufigkeitsanzahl aus mehreren Datenrahmenspalten abrufen

Um die Häufigkeit identischer Zeilen in einem Datenrahmen zu bestimmen, können Sie die Methode groupby() verwenden mit der Funktion size(). Mit dieser Technik können Sie das Vorkommen eindeutiger Wertekombinationen über mehrere Spalten hinweg zählen.

Betrachten Sie den folgenden Datenrahmen:

   Group | Size |
---------+------+
   Short | Small |
   Short | Small |
   Moderate | Medium |
   Moderate | Small |
   Tall | Large |
Nach dem Login kopieren

Um die Häufigkeit jeder Zeile zu zählen, können wir den Datenrahmen gruppieren durch die Spalten „Gruppe“ und „Größe“ und verwenden Sie die Funktion size(), um zu bestimmen, wie oft jede Zeile erscheint:

<code class="python">import pandas as pd

# Load the sample data
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']}
df = pd.DataFrame(data)

# Option 1:
dfg = df.groupby(by=["Group", "Size"]).size()

# Option 2: Reset the index to convert the Series to a DataFrame
dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")

# Option 3: Use as_index=False to create a DataFrame without an index
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()</code>
Nach dem Login kopieren

Die resultierenden Datenrahmen liefern die Häufigkeitsanzahl für jede Kombination von „Gruppe“. „ und „Größe“-Werte. Die Ausgabe könnte beispielsweise wie folgt aussehen:

  Group | Size | Time
--------+------+------
  Moderate | Medium | 1
  Moderate | Small | 1
  Short | Small | 2
  Tall | Large | 1
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie kann ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame basierend auf mehreren Spalten zählen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage