Analyse RFM à l'aide de Python-Tutoriel Python-php.cn

Table des matières

Comprendre l'analyse RFM

Implémentation de l'analyse RFM en Python

Étape 1 : Importer les bibliothèques requises

Étape 2 : Charger et préparer les données

Étape 3 : Calculer l'indicateur RFM

Étape 4 : Attribuer des scores RFM

Étape 5 : Combinez les scores RFM

Sortie

Conclusion

Maison

développement back-end

Tutoriel Python

Analyse RFM à l'aide de Python

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 03, 2023 pm 12:45 PM

python analyse RFM conduire

Analyse RFM à laide de Python

Python est un langage de programmation polyvalent populaire dans le domaine de l'analyse de données et de l'apprentissage automatique. Sa simplicité, sa lisibilité et sa riche bibliothèque le rendent idéal pour gérer des tâches de données complexes. L'une de ces applications puissantes est l'analyse RFM, une technique utilisée en marketing pour segmenter les clients en fonction de leur comportement d'achat.

Dans ce tutoriel, nous vous guiderons tout au long du processus de mise en œuvre de l'analyse RFM à l'aide de Python. Nous commencerons par expliquer le concept d’analyse RFM et son importance en marketing. Nous plongerons ensuite progressivement dans les aspects pratiques de l’analyse RFM à l’aide de Python. Dans la partie suivante de l'article, nous montrerons comment calculer un score RFM pour chaque client à l'aide de Python, en tenant compte des différentes manières d'attribuer des scores de récence, de fréquence et de valeur monétaire.

Comprendre l'analyse RFM

L'analyse RFM est une technique puissante utilisée en marketing pour segmenter les clients en fonction de leur comportement d'achat. L'acronyme RFM signifie Récence, Fréquence et Valeur monétaire, trois facteurs clés utilisés pour évaluer et classer les clients. Décomposons chaque composant pour comprendre son importance dans l'analyse RFM.

Récence : La récence fait référence au temps qui s'est écoulé depuis le dernier achat du client. Cela nous aide à comprendre comment les clients ont récemment interagi avec l'entreprise.
Fréquence : La fréquence fait référence au nombre de fois qu'un client effectue un achat dans un laps de temps donné. Cela nous aide à comprendre à quelle fréquence nos clients interagissent avec notre entreprise.
Valeur monétaire : La valeur monétaire fait référence au montant total dépensé par le client pour l'achat. Cela nous aide à comprendre la valeur des transactions clients et leur valeur potentielle pour l’entreprise.

Maintenant que nous comprenons l'analyse RFM, apprenons comment l'implémenter en Python dans la prochaine partie de cet article.

Implémentation de l'analyse RFM en Python

Pour effectuer une analyse RFM à l'aide de Python, nous nous appuierons sur deux bibliothèques de base : Pandas et NumPy. Pour installer NumPy et Pandas sur votre ordinateur, nous utiliserons pip (gestionnaire de packages Python). Ouvrez votre terminal ou votre invite de commande et exécutez la commande suivante :

pip install pandas
pip install numpy

Copier après la connexion

Une fois l'installation terminée, nous pouvons continuer à implémenter l'analyse RFM à l'aide de Python.

Étape 1 : Importer les bibliothèques requises

Tout d’abord, importons les bibliothèques nécessaires dans notre script Python :

import pandas as pd
import numpy as np

Copier après la connexion

Étape 2 : Charger et préparer les données

Ensuite, nous devons charger et préparer les données pour l'analyse RFM. Supposons que nous ayons un ensemble de données appelé « customer_data.csv » qui contient des informations sur les transactions clients, notamment l'identifiant client, la date de la transaction et le montant de l'achat. Nous pouvons utiliser Pandas pour lire des données dans un DataFrame et les prétraiter pour analyse.

# Load the data from the CSV file
df = pd.read_csv('customer_data.csv')

# Convert the transaction date column to datetime format
df['transaction_date'] = pd.to_datetime(df['transaction_date'])

Copier après la connexion

Étape 3 : Calculer l'indicateur RFM

Maintenant, allons de l'avant et calculons la métrique RFM pour chaque client. En utilisant une série de fonctions et d'opérations, nous déterminerons un score pour le temps d'achat récent, la fréquence d'achat et le montant de l'achat.

# Calculate recency by subtracting the latest transaction date from each customer's transaction date
df['recency'] = pd.to_datetime('2023-06-02') - df['transaction_date']

# Calculate frequency by counting the number of transactions for each customer
df_frequency = df.groupby('customer_id').agg({'transaction_id': 'nunique'})
df_frequency = df_frequency.rename(columns={'transaction_id': 'frequency'})

# Calculate monetary value by summing the purchase amounts for each customer
df_monetary = df.groupby('customer_id').agg({'purchase_amount': 'sum'})
df_monetary = df_monetary.rename(columns={'purchase_amount': 'monetary_value'})

Copier après la connexion

Étape 4 : Attribuer des scores RFM

Dans cette étape, nous attribuerons des scores pour les mesures de récence, de fréquence et de valeur monétaire, nous permettant d'évaluer et de classer les clients en fonction de leur comportement d'achat. Il est important de noter que vous pouvez personnaliser les critères de notation en fonction des exigences uniques de votre projet.

# Define score ranges and assign scores to recency, frequency, and monetary value
recency_scores = pd.qcut(df['recency'].dt.days, q=5, labels=False)
frequency_scores = pd.qcut(df_frequency['frequency'], q=5, labels=False)
monetary_scores = pd.qcut(df_monetary['monetary_value'], q=5, labels=False)

# Assign the calculated scores to the DataFrame
df['recency_score'] = recency_scores
df_frequency['frequency_score'] = frequency_scores
df_monetary['monetary_score'] = monetary_scores

Copier après la connexion

Étape 5 : Combinez les scores RFM

Enfin, nous combinerons les scores RFM individuels de chaque client en un seul score RFM.

# Combine the RFM scores into a single RFM score
df['RFM_score'] = df['recency_score'].astype(str) + df_frequency['frequency_score'].astype(str) + df_monetary['monetary_score'].astype(str)

# print data  
print(df)

Copier après la connexion

Lorsque vous exécutez le code fourni ci-dessus pour calculer le score RFM à l'aide de Python, vous verrez le résultat suivant :

Sortie

   customer_id transaction_date  purchase_amount  recency  recency_score  frequency_score  monetary_score RFM_score
0      1234567       2023-01-15             50.0 138 days              3                1               2       312
1      2345678       2023-02-01             80.0 121 days              3                2               3       323
2      3456789       2023-03-10            120.0  84 days              4                3               4       434
3      4567890       2023-05-05             70.0  28 days              5                4               3       543
4      5678901       2023-05-20            100.0  13 days              5                5               4       554

Copier après la connexion

Comme vous pouvez le voir dans le résultat ci-dessus, il affiche les données de chaque client, y compris son identifiant client unique, sa date_de transaction et son montant d'achat. La colonne de récence représente la récence en jours. Les colonnes recency_score, Frequency_score et monetary_score affichent le score d'allocation pour chaque métrique.

Enfin, la colonne RFM_score combine les scores individuels de récence, de fréquence et de valeur monétaire en un seul score RFM. Ce score peut être utilisé pour segmenter les clients et comprendre leur comportement et leurs préférences.

C'est tout ! Vous avez calculé avec succès le score RFM de chaque client à l'aide de Python.

Conclusion

En conclusion, l'analyse RFM est une technique très utile en marketing, qui nous permet de segmenter les clients en fonction de leur comportement d'achat. Dans ce didacticiel, nous explorons le concept d'analyse RFM et son importance en marketing. Nous fournissons un guide étape par étape pour implémenter l’analyse RFM à l’aide de Python. Nous présentons les bibliothèques Python nécessaires telles que Pandas et NumPy, et montrons comment calculer le score RFM pour chaque client. Nous fournissons des exemples et des explications pour chaque étape du processus, le rendant facile à suivre.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Commandes de chat et comment les utiliser

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7542

Tutoriel CakePHP

1381

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

PHP et Python: exemples de code et comparaison Apr 15, 2025 am 12:07 AM

PHP et Python ont leurs propres avantages et inconvénients, et le choix dépend des besoins du projet et des préférences personnelles. 1.Php convient au développement rapide et à la maintenance des applications Web à grande échelle. 2. Python domine le domaine de la science des données et de l'apprentissage automatique.

Comment entraîner le modèle Pytorch sur Centos Apr 14, 2025 pm 03:03 PM

Une formation efficace des modèles Pytorch sur les systèmes CentOS nécessite des étapes, et cet article fournira des guides détaillés. 1. Préparation de l'environnement: Installation de Python et de dépendance: le système CentOS préinstalle généralement Python, mais la version peut être plus ancienne. Il est recommandé d'utiliser YUM ou DNF pour installer Python 3 et Mettez PIP: sudoyuMupDatePython3 (ou sudodnfupdatepython3), pip3install-upradepip. CUDA et CUDNN (accélération GPU): Si vous utilisez Nvidiagpu, vous devez installer Cudatool

Explication détaillée du principe docker Apr 14, 2025 pm 11:57 PM

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

Comment est la prise en charge du GPU pour Pytorch sur Centos Apr 14, 2025 pm 06:48 PM

Activer l'accélération du GPU Pytorch sur le système CentOS nécessite l'installation de versions CUDA, CUDNN et GPU de Pytorch. Les étapes suivantes vous guideront tout au long du processus: CUDA et CUDNN Installation détermineront la compatibilité de la version CUDA: utilisez la commande NVIDIA-SMI pour afficher la version CUDA prise en charge par votre carte graphique NVIDIA. Par exemple, votre carte graphique MX450 peut prendre en charge CUDA11.1 ou plus. Téléchargez et installez Cudatoolkit: visitez le site officiel de Nvidiacudatoolkit et téléchargez et installez la version correspondante selon la version CUDA la plus élevée prise en charge par votre carte graphique. Installez la bibliothèque CUDNN:

Python vs JavaScript: communauté, bibliothèques et ressources Apr 15, 2025 am 12:16 AM

Python et JavaScript ont leurs propres avantages et inconvénients en termes de communauté, de bibliothèques et de ressources. 1) La communauté Python est amicale et adaptée aux débutants, mais les ressources de développement frontal ne sont pas aussi riches que JavaScript. 2) Python est puissant dans les bibliothèques de science des données et d'apprentissage automatique, tandis que JavaScript est meilleur dans les bibliothèques et les cadres de développement frontaux. 3) Les deux ont des ressources d'apprentissage riches, mais Python convient pour commencer par des documents officiels, tandis que JavaScript est meilleur avec MDNWEBDOCS. Le choix doit être basé sur les besoins du projet et les intérêts personnels.

Comment choisir la version Pytorch sous Centos Apr 14, 2025 pm 02:51 PM

Lors de la sélection d'une version Pytorch sous CentOS, les facteurs clés suivants doivent être pris en compte: 1. CUDA Version Compatibilité GPU Prise en charge: si vous avez NVIDIA GPU et que vous souhaitez utiliser l'accélération GPU, vous devez choisir Pytorch qui prend en charge la version CUDA correspondante. Vous pouvez afficher la version CUDA prise en charge en exécutant la commande nvidia-SMI. Version CPU: Si vous n'avez pas de GPU ou que vous ne souhaitez pas utiliser de GPU, vous pouvez choisir une version CPU de Pytorch. 2. Version Python Pytorch

Miniopen Centos Compatibilité Apr 14, 2025 pm 05:45 PM

Minio Object Storage: Déploiement haute performance dans le système Centos System Minio est un système de stockage d'objets distribué haute performance développé sur la base du langage Go, compatible avec Amazons3. Il prend en charge une variété de langages clients, notamment Java, Python, JavaScript et GO. Cet article introduira brièvement l'installation et la compatibilité de Minio sur les systèmes CentOS. Compatibilité de la version CentOS Minio a été vérifiée sur plusieurs versions CentOS, y compris, mais sans s'y limiter: CentOS7.9: fournit un guide d'installation complet couvrant la configuration du cluster, la préparation de l'environnement, les paramètres de fichiers de configuration, le partitionnement du disque et la mini

Comment installer nginx dans Centos Apr 14, 2025 pm 08:06 PM

CENTOS L'installation de Nginx nécessite de suivre les étapes suivantes: Installation de dépendances telles que les outils de développement, le devet PCRE et l'OpenSSL. Téléchargez le package de code source Nginx, dézippez-le et compilez-le et installez-le, et spécifiez le chemin d'installation AS / USR / LOCAL / NGINX. Créez des utilisateurs et des groupes d'utilisateurs de Nginx et définissez les autorisations. Modifiez le fichier de configuration nginx.conf et configurez le port d'écoute et le nom de domaine / adresse IP. Démarrez le service Nginx. Les erreurs communes doivent être prêtées à prêter attention, telles que les problèmes de dépendance, les conflits de port et les erreurs de fichiers de configuration. L'optimisation des performances doit être ajustée en fonction de la situation spécifique, comme l'activation du cache et l'ajustement du nombre de processus de travail.

See all articles