Angenommen, ein DataFrame enthält Spalten für ID (id), Gruppe (group ) und Begriff (Begriff) besteht das Ziel darin, die Vorkommen jedes Begriffs für jede eindeutige Kombination aus ID und effizient zu zählen Gruppe.
Durch die Nutzung der leistungsstarken Groupby- und Size-Funktionen von Pandas können wir dies erreichen, ohne auf Schleifen zurückgreifen zu müssen:
df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
Dies Die Operation erzeugt einen hierarchischen MultiIndex-DataFrame, der den Begriff darstellt zählt:
</p> <div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false"> term
Gruppe term1 term2 term3
id
1 3 2 0
2 2 1 1
Auch für Bei riesigen Datensätzen mit Millionen von Zeilen zeigt dieser vektorisierte Ansatz eine außergewöhnliche Leistung:
1,000,000 rows ---------------- Elapsed time: 1.2 seconds
Das obige ist der detaillierte Inhalt vonWie kann man Termvorkommen in Pandas effizient nach ID und Gruppe zählen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!