Heim > Backend-Entwicklung > Python-Tutorial > Von Daten zu Strategien: Wie Statistiken zu vertrauenswürdigen Marketingentscheidungen führen können

Von Daten zu Strategien: Wie Statistiken zu vertrauenswürdigen Marketingentscheidungen führen können

Mary-Kate Olsen
Freigeben: 2024-12-05 04:25:11
Original
377 Leute haben es durchsucht

Statistik ist ein leistungsstarkes Tool, mit dem wir komplexe Probleme angehen und Fragen beantworten können, die bei der erstmaligen Beobachtung von Daten oder Mustern auftauchen. Ein Beispiel hierfür könnte die Analyse der Persönlichkeit von Kunden in einem Supermarkt sein. Fragen wie Unterscheidet sich diese Gruppe wirklich von den anderen? Inwieweit? Sollte ich mich mehr auf diese Gruppe konzentrieren, um ihr Erlebnis und meine Verkäufe zu verbessern? Sie sind der Schlüssel zum Treffen guter Entscheidungen.

Visualisierungen können uns zwar helfen, Daten schnell zu verstehen, sie sind jedoch nicht immer 100 % zuverlässig. Wir konnten deutliche Unterschiede zwischen den Gruppen beobachten, aber diese Unterschiede sind möglicherweise nicht statistisch signifikant.

Hier kommt die Statistik ins Spiel: Sie hilft uns nicht nur, die Daten tiefer zu analysieren, sondern gibt uns auch die Sicherheit, unsere Annahmen zu bestätigen. Als Datenwissenschaftler oder Entscheidungsträger müssen wir uns darüber im Klaren sein, dass falsche Analysen zu falschen Entscheidungen führen können, was zu Zeit- und Geldverlusten führt. Daher ist es von entscheidender Bedeutung, dass unsere Schlussfolgerungen fundiert sind und durch statistische Beweise gestützt werden.

De Datos a Estrategias: Cómo la Estadística Puede Impulsar Decisiones Confiables en Marketing

Wahre Zufriedenheit entsteht, wenn wir sehen, dass sich die Ergebnisse unserer Analyse in wirksamen Veränderungen im Unternehmen, Verbesserungen im Kundenerlebnis und letztendlich einer positiven Auswirkung auf Vertrieb und Betrieb widerspiegeln. Es ist ein unglaubliches Gefühl, Teil dieses Prozesses gewesen zu sein!


Um Ihnen bei der Entwicklung dieser Fähigkeit zu helfen, werden wir in diesem Artikel zur Persönlichkeitsanalyse von Supermarktkunden den Kaggle-Datensatz Kundenpersönlichkeitsanalyse verwenden: https://www.kaggle.com/datasets / imakash3011/customer-personality-analysis

In dieser Analyse untersuchen wir das Verhalten der Kunden eines Supermarkts mit dem Ziel, aus den Daten wertvolle Informationen zu extrahieren. Wir werden versuchen, die folgenden Fragen zu beantworten:

  • Gibt es einen signifikanten Unterschied bei den Gesamtausgaben nach Bildung?
  • Gibt es einen signifikanten Unterschied bei den Gesamtausgaben nach Anzahl der Kinder?
  • Gibt es einen signifikanten Unterschied bei den Gesamtausgaben nach Familienstand?

Obwohl diese Analyse noch viel weiter ausgedehnt werden könnte, werden wir uns auf die Beantwortung dieser drei Fragen konzentrieren, da sie eine große Erklärungskraft bieten. Im gesamten Artikel zeigen wir Ihnen, wie wir diese Fragen beantworten können und wie wir mit demselben Ansatz noch viele weitere Fragen beantworten können.

In diesem Artikel befassen wir uns mit statistischen Analysen wie dem Kolmogorov-Smirnov-Test, dem Levene-Test und wie man weiß, wann man ANOVA anwenden sollte Kruskal -Wallis. Diese Namen mögen für Sie ungewohnt klingen, aber keine Sorge, ich werde sie auf einfache Weise erklären, damit Sie sie ohne Komplikationen verstehen.

Als Nächstes zeige ich Ihnen den Python-Code und die Schritte, die Sie befolgen müssen, um diese statistischen Analysen effektiv durchzuführen.

1. Erste Schritte

Wir importieren die notwendigen Python-Bibliotheken.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Jetzt können wir zwei Möglichkeiten zum Hochladen der CSV-Datei wählen: Wir erhalten die Datei direkt oder wir können den Kaggle-Link direkt auf der Download-Schaltfläche abrufen.

#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

De Datos a Estrategias: Cómo la Estadística Puede Impulsar Decisiones Confiables en Marketing

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
#Obtenemos el nombre del archivo
nombre_archivo = os.listdir(path)[0]
nombre_archivo
Nach dem Login kopieren
Nach dem Login kopieren
ID Year_Birth Education Marital_Status Income Kidhome Teenhome Dt_Customer Recency MntWines MntFruits MntMeatProducts MntFishProducts MntSweetProducts MntGoldProds NumDealsPurchases NumWebPurchases NumCatalogPurchases NumStorePurchases NumWebVisitsMonth AcceptedCmp3 AcceptedCmp4 AcceptedCmp5 AcceptedCmp1 AcceptedCmp2 Complain Z_CostContact Z_Revenue Response
0 5524 1957 Graduation Single 58138.0 0 0 04-09-2012 58 635 88 546 172 88 88 3 8 10 4 7 0 0 0 0 0 0 3 11 1
1 2174 1954 Graduation Single 46344.0 1 1 08-03-2014 38 11 1 6 2 1 6 2 1 1 2 5 0 0 0 0 0 0 3 11 0
2 4141 1965 Graduation Together 71613.0 0 0 21-08-2013 26 426 49 127 111 21 42 1 8 2 10 4 0 0 0 0 0 0 3 11 0

Um eine bessere Vorstellung von dem Datensatz zu bekommen, den wir analysieren werden, werde ich die Bedeutung jeder Spalte angeben.

Spalten:

  • Personen:

    • ID:eindeutige Kennung des Kunden
    • Geburtsjahr:Geburtsjahr des Kunden.
    • Bildung:Bildungsniveau des Kunden.
    • Familienstand:Familienstand des Kunden
    • Einkommen:Jahreseinkommen des Haushalts des Kunden
    • Kidhome:Anzahl der Kinder im Haus des Kunden
    • Teenhome:Anzahl der Teenager im Haus des Kunden
    • Dt_Customer:Datum der Kundenregistrierung im Unternehmen
    • Aktualität: Anzahl der Tage seit dem letzten Kauf des Kunden.
    • Beschweren: 1, wenn sich der Kunde in den letzten 2 Jahren beschwert hat, sonst 0
  • Produkte:

    • MntWines: Betrag, der in den letzten 2 Jahren für Wein ausgegeben wurde.
    • MntFruits: Betrag, der in den letzten 2 Jahren für Obst ausgegeben wurde.
    • MntMeatProducts: Betrag, der in den letzten 2 Jahren für Fleisch ausgegeben wurde.
    • MntFishProducts:Betrag, der in den letzten 2 Jahren für Fisch ausgegeben wurde.
    • MntSweetProducts:Betrag, der in den letzten 2 Jahren für Süßigkeiten ausgegeben wurde.
    • MntGoldProds:Betrag, der in den letzten 2 Jahren für Gold ausgegeben wurde.
  • Aktion:

    • NumDealsPurchases:Anzahl der mit Rabatt getätigten Käufe.
    • AcceptedCmp1: 1, wenn der Kunde das Angebot in der ersten Kampagne angenommen hat, andernfalls 0.
    • AcceptedCmp2: 1, wenn der Kunde das Angebot in der zweiten Kampagne angenommen hat, andernfalls 0.
    • AcceptedCmp3: 1, wenn der Kunde das Angebot in der dritten Kampagne angenommen hat, andernfalls 0.
    • AcceptedCmp4: 1, wenn der Kunde das Angebot in der vierten Kampagne angenommen hat, andernfalls 0.
    • AcceptedCmp5: 1, wenn der Kunde das Angebot in der fünften Kampagne angenommen hat, andernfalls 0.
    • Antwort: 1, wenn der Kunde das Angebot in der letzten Kampagne angenommen hat, andernfalls 0
  • Ort:

    • NumWebPurchases:Anzahl der über die Unternehmenswebsite getätigten Käufe.
    • NumCatalogPurchases: Anzahl der über einen Katalog getätigten Käufe.
    • NumStorePurchases:Anzahl der Einkäufe, die direkt in Geschäften getätigt wurden.
    • NumWebVisitsMonth: Anzahl der Besuche auf der Website des Unternehmens im letzten Monat.

Ja, es gibt viele Spalten, hier werden wir jedoch nur einige wenige verwenden, um nicht zu sehr zu erweitern. Auf jeden Fall können Sie die gleichen Schritte für die anderen Spalten anwenden.

Jetzt überprüfen wir, dass wir keine Nulldaten haben

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Wir können feststellen, dass wir 24 Nulldaten in der Spalte „Einkommen“ haben, diese Spalte wird jedoch in dieser Analyse nicht verwendet, daher werden wir nichts damit machen, falls Sie sie verwenden möchten, Sie müssen überprüfen, ob Sie eine dieser beiden Optionen ausführen:

  • Imputieren Sie die fehlenden Daten, wenn sie nicht mehr als 5 % der Gesamtdaten ausmachen (Empfehlung).
  • Nulldaten löschen.

2. Konfigurieren Sie den Datensatz für die Analyse

Wir behalten die Spalten bei, die für uns von Interesse sind, wie unter anderem Bildung, Kinder, Familienstand, Höhe der Ausgaben pro Produktkategorie.

#Obtenemos el nombre del archivo
nombre_archivo = os.listdir(path)[0]
nombre_archivo
Nach dem Login kopieren
Nach dem Login kopieren

Wir berechnen den Gesamtaufwand, indem wir die Ausgaben aller Produktkategorien addieren.

'marketing_campaign.csv'
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonVon Daten zu Strategien: Wie Statistiken zu vertrauenswürdigen Marketingentscheidungen führen können. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:dev.to
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage