Prozentsatz der Gesamtsumme mit Groupby in Pandas
Dieser Artikel konzentriert sich auf eine häufige Aufgabe in der Datenanalyse: die Berechnung des Prozentsatzes einer Gesamtsumme für jeden Gruppe innerhalb eines DataFrame. Hier ist die Frage und eine Lösung mit Pandas.
Frage:
Ich habe eine CSV-Datei mit den Spalten „Staat“, „Büro-ID“ und „Verkäufe“. Ich möchte den Prozentsatz des Umsatzes pro Büro in einem bestimmten Bundesstaat berechnen, wobei die Summe aller Prozentsätze in jedem Bundesstaat 100 % beträgt.
Lösung:
Zu erreichen Dazu müssen wir eine zweite Groupby-Ebene erstellen.
Zunächst können wir ein Groupby-Objekt basierend auf „state“ und „office_id“ erstellen. Spalten:
Dann erstellen wir einen neuen DataFrame, indem wir jeden Umsatzwert durch die entsprechende Summe nach Bundesstaat dividieren:
Dieser Ansatz verfolgt die Summe der Verkäufe pro Bundesstaat Dabei wird sichergestellt, dass der Prozentsatz jeder Gruppe innerhalb eines Staates 100 % beträgt.
Das obige ist der detaillierte Inhalt vonWie berechnet man mithilfe von Pandas den Prozentsatz des Umsatzes pro Büro in jedem Bundesstaat?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!