Statistik ist ein leistungsstarkes Tool, mit dem wir komplexe Probleme angehen und Fragen beantworten können, die bei der erstmaligen Beobachtung von Daten oder Mustern auftauchen. Ein Beispiel hierfür könnte die Analyse der Persönlichkeit von Kunden in einem Supermarkt sein. Fragen wie Unterscheidet sich diese Gruppe wirklich von den anderen? Inwieweit? Sollte ich mich mehr auf diese Gruppe konzentrieren, um ihr Erlebnis und meine Verkäufe zu verbessern? Sie sind der Schlüssel zum Treffen guter Entscheidungen.
Visualisierungen können uns zwar helfen, Daten schnell zu verstehen, sie sind jedoch nicht immer 100 % zuverlässig. Wir konnten deutliche Unterschiede zwischen den Gruppen beobachten, aber diese Unterschiede sind möglicherweise nicht statistisch signifikant.
Hier kommt die Statistik ins Spiel: Sie hilft uns nicht nur, die Daten tiefer zu analysieren, sondern gibt uns auch die Sicherheit, unsere Annahmen zu bestätigen. Als Datenwissenschaftler oder Entscheidungsträger müssen wir uns darüber im Klaren sein, dass falsche Analysen zu falschen Entscheidungen führen können, was zu Zeit- und Geldverlusten führt. Daher ist es von entscheidender Bedeutung, dass unsere Schlussfolgerungen fundiert sind und durch statistische Beweise gestützt werden.
Wahre Zufriedenheit entsteht, wenn wir sehen, dass sich die Ergebnisse unserer Analyse in wirksamen Veränderungen im Unternehmen, Verbesserungen im Kundenerlebnis und letztendlich einer positiven Auswirkung auf Vertrieb und Betrieb widerspiegeln. Es ist ein unglaubliches Gefühl, Teil dieses Prozesses gewesen zu sein!
Um Ihnen bei der Entwicklung dieser Fähigkeit zu helfen, werden wir in diesem Artikel zur Persönlichkeitsanalyse von Supermarktkunden den Kaggle-Datensatz Kundenpersönlichkeitsanalyse verwenden: https://www.kaggle.com/datasets / imakash3011/customer-personality-analysis
In dieser Analyse untersuchen wir das Verhalten der Kunden eines Supermarkts mit dem Ziel, aus den Daten wertvolle Informationen zu extrahieren. Wir werden versuchen, die folgenden Fragen zu beantworten:
Obwohl diese Analyse noch viel weiter ausgedehnt werden könnte, werden wir uns auf die Beantwortung dieser drei Fragen konzentrieren, da sie eine große Erklärungskraft bieten. Im gesamten Artikel zeigen wir Ihnen, wie wir diese Fragen beantworten können und wie wir mit demselben Ansatz noch viele weitere Fragen beantworten können.
In diesem Artikel befassen wir uns mit statistischen Analysen wie dem Kolmogorov-Smirnov-Test, dem Levene-Test und wie man weiß, wann man ANOVA anwenden sollte Kruskal -Wallis. Diese Namen mögen für Sie ungewohnt klingen, aber keine Sorge, ich werde sie auf einfache Weise erklären, damit Sie sie ohne Komplikationen verstehen.
Wir importieren die notwendigen Python-Bibliotheken.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
Jetzt können wir zwei Möglichkeiten zum Hochladen der CSV-Datei wählen: Wir erhalten die Datei direkt oder wir können den Kaggle-Link direkt auf der Download-Schaltfläche abrufen.
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
#Obtenemos el nombre del archivo nombre_archivo = os.listdir(path)[0] nombre_archivo
ID | Year_Birth | Education | Marital_Status | Income | Kidhome | Teenhome | Dt_Customer | Recency | MntWines | MntFruits | MntMeatProducts | MntFishProducts | MntSweetProducts | MntGoldProds | NumDealsPurchases | NumWebPurchases | NumCatalogPurchases | NumStorePurchases | NumWebVisitsMonth | AcceptedCmp3 | AcceptedCmp4 | AcceptedCmp5 | AcceptedCmp1 | AcceptedCmp2 | Complain | Z_CostContact | Z_Revenue | Response | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 5524 | 1957 | Graduation | Single | 58138.0 | 0 | 0 | 04-09-2012 | 58 | 635 | 88 | 546 | 172 | 88 | 88 | 3 | 8 | 10 | 4 | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 1 |
1 | 2174 | 1954 | Graduation | Single | 46344.0 | 1 | 1 | 08-03-2014 | 38 | 11 | 1 | 6 | 2 | 1 | 6 | 2 | 1 | 1 | 2 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
2 | 4141 | 1965 | Graduation | Together | 71613.0 | 0 | 0 | 21-08-2013 | 26 | 426 | 49 | 127 | 111 | 21 | 42 | 1 | 8 | 2 | 10 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
Um eine bessere Vorstellung von dem Datensatz zu bekommen, den wir analysieren werden, werde ich die Bedeutung jeder Spalte angeben.
Spalten:
Personen:
Produkte:
Aktion:
Ort:
Ja, es gibt viele Spalten, hier werden wir jedoch nur einige wenige verwenden, um nicht zu sehr zu erweitern. Auf jeden Fall können Sie die gleichen Schritte für die anderen Spalten anwenden.
Jetzt überprüfen wir, dass wir keine Nulldaten haben
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np import os
#pip install kagglehub import kagglehub # Download latest version path = kagglehub.dataset_download("imakash3011/customer-personality-analysis") print("Path to dataset files:", path)
Wir können feststellen, dass wir 24 Nulldaten in der Spalte „Einkommen“ haben, diese Spalte wird jedoch in dieser Analyse nicht verwendet, daher werden wir nichts damit machen, falls Sie sie verwenden möchten, Sie müssen überprüfen, ob Sie eine dieser beiden Optionen ausführen:
Wir behalten die Spalten bei, die für uns von Interesse sind, wie unter anderem Bildung, Kinder, Familienstand, Höhe der Ausgaben pro Produktkategorie.
#Obtenemos el nombre del archivo nombre_archivo = os.listdir(path)[0] nombre_archivo
Wir berechnen den Gesamtaufwand, indem wir die Ausgaben aller Produktkategorien addieren.
'marketing_campaign.csv'
Das obige ist der detaillierte Inhalt vonVon Daten zu Strategien: Wie Statistiken zu vertrauenswürdigen Marketingentscheidungen führen können. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!