データから戦略へ: 統計が信頼できるマーケティング上の意思決定をどのように推進できるか-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

データから戦略へ: 統計が信頼できるマーケティング上の意思決定をどのように推進できるか

Mary-Kate Olsen

Dec 05, 2024 am 04:25 AM

統計は、複雑な問題に対処し、データやパターンを初めて観察するときに生じる疑問に答えることを可能にする強力なツールです。この例としては、スーパーマーケットでの顧客の性格分析が挙げられます。このグループは他のグループとは本当に違うの?どこまで？彼らのエクスペリエンスと売上を向上させるために、このグループにもっと焦点を当てるべきでしょうか? 彼らは適切な決定を下すための鍵です。

視覚化はデータを迅速に理解するのに役立ちますが、常に 100% 信頼できるわけではありません。グループ間の明らかな違いは観察できましたが、それらの違いは統計的に有意ではない可能性があります。

ここで統計が役に立ちます。統計は、データをより深く分析するのに役立つだけでなく、仮説を検証する自信を与えてくれます。データサイエンティストまたは意思決定の専門家として、私たちは間違った分析が間違った決定につながり、時間とお金の損失につながる可能性があることを認識する必要があります。したがって、統計的証拠によって裏付けられた十分な根拠のある結論が重要です。

De Datos a Estrategias: Cómo la Estadística Puede Impulsar Decisiones Confiables en Marketing

真の満足は、分析の結果が社内の効果的な変化、顧客エクスペリエンスの向上、そして最終的には販売と業務へのプラスの影響に反映されているのを見るときに得られます。 そのプロセスに参加できたことは信じられないほどの気分です!

この記事でスーパーマーケットの顧客の性格分析で開発するこのスキルを開発するのに役立つように、Kaggle データセット 顧客の性格分析 を使用します: https://www.kaggle.com/datasets / imakash3011/顧客性格分析

この分析では、データから貴重な情報を抽出することを目的として、スーパーマーケットの顧客の行動を調査します。私たちは次の質問に答えようとします:

教育による総支出に大きな違いはありますか?
子供の数によって総支出に大きな違いはありますか?
婚姻状況によって総支出に大きな違いはありますか?

この分析はさらに拡張することもできますが、説明力が大きいため、これら 3 つの質問に答えることに焦点を当てます。この記事全体を通じて、これらの質問にどのように対処できるか、また、同じアプローチを通じてさらに多くの質問にどのように回答できるかを示します。

この記事では、Kolmogorov-Smirnov テスト、Levene テストなどの統計分析と、いつ ANOVA を適用するかを判断する方法について説明します。 クラスカル-ウォリス。これらの名前は聞きなれないかもしれませんが、複雑にせずに理解できるように簡単に説明しますので、ご安心ください。

次に、Python コードと、これらの統計分析を効果的に実行するための手順を示します。

1. はじめに

必要な Python ライブラリをインポートします。

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os

ログイン後にコピー

これで、.csv ファイルをアップロードする 2 つの方法を選択できるようになりました。ファイルを直接取得するか、ダウンロードボタンから直接 kaggle リンクを取得することができます。

#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)

ログイン後にコピー

De Datos a Estrategias: Cómo la Estadística Puede Impulsar Decisiones Confiables en Marketing

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os

ログイン後にコピー

#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)

ログイン後にコピー

#Obtenemos el nombre del archivo
nombre_archivo = os.listdir(path)[0]
nombre_archivo

ログイン後にコピー

	ID	Year_Birth	Education	Marital_Status	Income	Kidhome	Teenhome	Dt_Customer	Recency	MntWines	MntFruits	MntMeatProducts	MntFishProducts	MntSweetProducts	MntGoldProds	NumDealsPurchases	NumWebPurchases	NumCatalogPurchases	NumStorePurchases	NumWebVisitsMonth	Z_CostContact	Z_Revenue	Response
0	5524	1957	Graduation	Single	58138.0	0	0	04-09-2012	58	635	88	546	172	88	88	3	8	10	4	7	3	11	1
1	2174	1954	Graduation	Single	46344.0	1	1	08-03-2014	38	11	1	6	2	1	6	2	1	1	2	5	3	11	0
2	4141	1965	Graduation	Together	71613.0	0	0	21-08-2013	26	426	49	127	111	21	42	1	8	2	10	4	3	11	0

分析するデータセットをよりよく理解するために、各列の意味を示します。

列:

人:
- ID: クライアントの一意の識別子
- Year_Birth: クライアントの誕生年。
- 教育: クライアントの教育レベル。
- Marital_Status: クライアントの婚姻状況
- 収入:クライアント世帯の年収
- Kidhome: クライアントの家の子供の数
- Teenhome: クライアントの家にいるティーンエイジャーの数
- Dt_Customer: 社内での顧客登録日
- 最新性: 顧客が最後に購入してからの日数。
- 苦情: 過去 2 年間に顧客から苦情があった場合は 1、それ以外の場合は 0
製品:
- MntWines: 過去 2 年間にワインに費やした金額。
- MntFruits: 過去 2 年間にフルーツに費やした金額。
- MntMeatProducts: 過去 2 年間に肉に費やされた金額。
- MntFishProducts: 過去 2 年間に魚に費やされた金額。
- MntSweetProducts: 過去 2 年間にお菓子に費やした金額。
- MntGoldProds: 過去 2 年間にゴールドに費やされた金額。
プロモーション:
- NumDealsPurchases: 割引で行われた購入数。
- AcceptedCmp1: 顧客が最初のキャンペーンでオファーを受け入れた場合は 1、それ以外の場合は 0。
- AcceptedCmp2: 顧客が 2 番目のキャンペーンでオファーを受け入れた場合は 1、それ以外の場合は 0。
- AcceptedCmp3: 顧客が 3 番目のキャンペーンでオファーを受け入れた場合は 1、それ以外の場合は 0。
- AcceptedCmp4: 顧客が 4 番目のキャンペーンでオファーを受け入れた場合は 1、それ以外の場合は 0。
- AcceptedCmp5: 顧客が 5 番目のキャンペーンでオファーを受け入れた場合は 1、それ以外の場合は 0。
- 応答: 顧客が最後のキャンペーンでオファーを受け入れた場合は 1、それ以外の場合は 0
場所:
- NumWebPurchases: 会社 Web サイトを通じて行われた購入数。
- NumCatalogPurchases: カタログを通じて行われた購入数。
- NumStorePurchases: 店舗で直接行われた購入数。
- NumWebVisitsMonth: 先月の会社の Web サイトへの訪問数。

はい、多くの列がありますが、ここでは拡張しすぎないようにいくつかの列のみを使用します。いずれの場合も、他の列にも同じ手順を適用できます。

次に、null データがないことを確認します

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os

ログイン後にコピー

#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)

ログイン後にコピー

収入列に 24 個の null データ があることがわかりますが、この列はこの分析では使用されないため、使用したい場合に備えて何も行いません。次の 2 つのオプションのいずれかを実行することを確認する必要があります:

欠損データが全データの 5% を超えていない場合は、欠損データを補完します (推奨)。
null データを削除します。

2. 分析用にデータセットを構成する

教育、子供、婚姻状況、製品カテゴリごとの支出額など、関心のある列は保持されます。

#Obtenemos el nombre del archivo
nombre_archivo = os.listdir(path)[0]
nombre_archivo

ログイン後にコピー

すべての製品カテゴリの費用を加算して、合計費用を計算します。

'marketing_campaign.csv'

ログイン後にコピー

以上がデータから戦略へ: 統計が信頼できるマーケティング上の意思決定をどのように推進できるかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1666

CakePHP チュートリアル

1425

Laravel チュートリアル

1328

PHP チュートリアル

1273

C# チュートリアル

1253

Related knowledge

Python：ゲーム、GUIなど Apr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

Python vs. C：曲線と使いやすさの学習 Apr 19, 2025 am 12:20 AM

Pythonは学習と使用が簡単ですが、Cはより強力ですが複雑です。 1。Python構文は簡潔で初心者に適しています。動的なタイピングと自動メモリ管理により、使いやすくなりますが、ランタイムエラーを引き起こす可能性があります。 2.Cは、高性能アプリケーションに適した低レベルの制御と高度な機能を提供しますが、学習しきい値が高く、手動メモリとタイプの安全管理が必要です。

Pythonと時間：勉強時間を最大限に活用する Apr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Python vs. C：パフォーマンスと効率の探索 Apr 18, 2025 am 12:20 AM

Pythonは開発効率でCよりも優れていますが、Cは実行パフォーマンスが高くなっています。 1。Pythonの簡潔な構文とリッチライブラリは、開発効率を向上させます。 2.Cのコンピレーションタイプの特性とハードウェア制御により、実行パフォーマンスが向上します。選択を行うときは、プロジェクトのニーズに基づいて開発速度と実行効率を比較検討する必要があります。

Python Standard Libraryの一部はどれですか：リストまたは配列はどれですか？ Apr 27, 2025 am 12:03 AM

PythonListSarePartOfThestAndardarenot.liestareBuilting-in、versatile、forStoringCollectionsのpythonlistarepart。

Python：自動化、スクリプト、およびタスク管理 Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1）自動化：OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2）スクリプトの書き込み：Psutilライブラリを使用してシステムリソースを監視します。 3）タスク管理：スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

Pythonの学習：2時間の毎日の研究で十分ですか？ Apr 18, 2025 am 12:22 AM

Pythonを1日2時間学ぶだけで十分ですか？それはあなたの目標と学習方法に依存します。 1）明確な学習計画を策定し、2）適切な学習リソースと方法を選択します。3）実践的な実践とレビューとレビューと統合を練習および統合し、統合すると、この期間中にPythonの基本的な知識と高度な機能を徐々に習得できます。