Heim > Backend-Entwicklung > Python-Tutorial > Wie kann man Termvorkommen innerhalb von ID-Gruppen-Kombinationen in einem Pandas-DataFrame effizient zählen?

Wie kann man Termvorkommen innerhalb von ID-Gruppen-Kombinationen in einem Pandas-DataFrame effizient zählen?

Linda Hamilton
Freigeben: 2024-12-06 15:23:13
Original
600 Leute haben es durchsucht

How to Efficiently Count Term Occurrences within ID-Group Combinations in a Pandas DataFrame?

Wie führt man Groupby-Wertzählungen für einen Pandas-Datenrahmen durch?

Sie müssen den Datenrahmen nach den Spalten „id“ und „group“ gruppieren und jeweils die Anzahl berechnen eindeutiger Wert in der Spalte „Begriff“ für jedes eindeutige Paar von „id“- und „group“-Werten. Mit anderen Worten, Sie müssen bestimmen, wie oft jeder Begriff in jeder ID-Gruppen-Kombination vorkommt.

Sie können dies mithilfe der Groupby- und Size-Funktionen von Pandas erreichen:

df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
Nach dem Login kopieren

Dies ergibt eine Tabelle mit der ID und der Gruppe als Indizes und dem Begriff als Spalten.

Timing

Diese Methode ist sehr effizient, selbst für große Datensätze. Für einen Datenrahmen mit 1.000.000 Zeilen dauert die Ausführung des obigen Codes nur etwa 6 Sekunden.

Das obige ist der detaillierte Inhalt vonWie kann man Termvorkommen innerhalb von ID-Gruppen-Kombinationen in einem Pandas-DataFrame effizient zählen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage