


Création d'un système de détection de fraude par carte de crédit en temps réel avec FastAPI et Machine Learning
Introduction
La fraude par carte de crédit constitue une menace importante pour le secteur financier, entraînant des milliards de dollars de pertes chaque année. Pour lutter contre cela, des modèles d’apprentissage automatique ont été développés pour détecter et prévenir les transactions frauduleuses en temps réel. Dans cet article, nous expliquerons le processus de création d'un système de détection de fraude par carte de crédit en temps réel à l'aide de FastAPI, un framework Web moderne pour Python et un classificateur Random Forest formé sur le populaire ensemble de données de détection de fraude par carte de crédit de Kaggle. 🎜>
Aperçu du projetLe but de ce projet est de créer un service Web qui prédit la probabilité qu'une transaction par carte de crédit soit frauduleuse. Le service accepte les données de transaction, les prétraite et renvoie une prédiction ainsi que la probabilité de fraude. Ce système est conçu pour être rapide, évolutif et facile à intégrer dans les systèmes financiers existants.
Composants clés
- Modèle d'apprentissage automatique : un classificateur de forêt aléatoire formé pour faire la distinction entre les transactions frauduleuses et légitimes.
- Prétraitement des données : standardisation des fonctionnalités de transaction pour garantir un fonctionnement optimal du modèle.
- API : une API RESTful construite avec FastAPI pour gérer les demandes de prédiction en temps réel.
L'ensemble de données utilisé dans ce projet est l'ensemble de données de détection de fraude par carte de crédit de Kaggle, qui contient 284 807 transactions, dont seulement 492 sont frauduleuses. Ce déséquilibre de classe présente un défi, mais il est résolu en suréchantillonnant la classe minoritaire.
Prétraitement des données
Les fonctionnalités sont d'abord standardisées à l'aide d'un StandardScaler de scikit-learn. L'ensemble de données est ensuite divisé en ensembles de formation et de test. Compte tenu du déséquilibre, la technique RandomOverSampler est appliquée pour équilibrer les classes avant d'entraîner le modèle.
from sklearn.preprocessing import StandardScaler from imblearn.over_sampling import RandomOverSampler # Standardize features scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Balance the dataset ros = RandomOverSampler(random_state=42) X_resampled, y_resampled = ros.fit_resample(X_scaled, y)
Nous formons un classificateur Random Forest, qui est bien adapté à la gestion d'ensembles de données déséquilibrés et fournit des prédictions robustes. Le modèle est entraîné sur les données suréchantillonnées et ses performances sont évaluées à l'aide de l'exactitude, de la précision, du rappel et de la courbe AUC-ROC.
from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import classification_report, roc_auc_score # Train the model model = RandomForestClassifier(n_estimators=100, random_state=42) model.fit(X_resampled, y_resampled) # Evaluate the model y_pred = model.predict(X_test_scaled) print(classification_report(y_test, y_pred)) print("AUC-ROC:", roc_auc_score(y_test, model.predict_proba(X_test_scaled)[:, 1]))
Avec le modèle entraîné et le scaler enregistrés à l'aide de joblib, nous passons à la création de l'application FastAPI. FastAPI est choisi pour sa rapidité et sa facilité d'utilisation, ce qui le rend idéal pour les applications en temps réel.
Création de l'API
L'application FastAPI définit un point de terminaison POST /predict/ qui accepte les données de transaction, les traite et renvoie la prédiction et la probabilité du modèle.
from fastapi import FastAPI, HTTPException from pydantic import BaseModel import joblib import pandas as pd # Load the trained model and scaler model = joblib.load("random_forest_model.pkl") scaler = joblib.load("scaler.pkl") app = FastAPI() class Transaction(BaseModel): V1: float V2: float # Include all other features used in your model Amount: float @app.post("/predict/") def predict(transaction: Transaction): try: data = pd.DataFrame([transaction.dict()]) scaled_data = scaler.transform(data) prediction = model.predict(scaled_data) prediction_proba = model.predict_proba(scaled_data) return {"fraud_prediction": int(prediction[0]), "probability": float(prediction_proba[0][1])} except Exception as e: raise HTTPException(status_code=400, detail=str(e))
Pour tester l'application localement, vous pouvez exécuter le serveur FastAPI à l'aide d'uvicorn et envoyer des requêtes POST au point de terminaison /predict/. Le service traitera les demandes entrantes, mettra à l'échelle les données et indiquera si la transaction est frauduleuse.
Exécuter l'API localement
uvicorn main:app --reload
curl -X POST http://127.0.0.1:8000/predict/ \ -H "Content-Type: application/json" \ -d '{"V1": -1.359807134, "V2": -0.072781173, ..., "Amount": 149.62}'
Conclusion
Dans cet article, nous avons construit un système de détection de fraude par carte de crédit en temps réel qui combine l'apprentissage automatique avec un framework Web moderne. Le lien github est ici. Le système est conçu pour traiter les données de transaction en temps réel et fournir des prévisions instantanées, ce qui en fait un outil précieux pour les institutions financières cherchant à lutter contre la fraude.
En déployant ce modèle à l'aide de FastAPI, nous garantissons que le service est non seulement rapide mais également évolutif, capable de traiter plusieurs requêtes simultanément. Ce projet peut être étendu avec des modèles plus sophistiqués, une ingénierie de fonctionnalités améliorée ou une intégration avec un environnement de production.
Prochaines étapes
Pour améliorer davantage le système, considérez les éléments suivants :
- Améliorations du modèle : Expérimentez avec des modèles plus avancés comme XGBoost ou les réseaux de neurones.
- Ingénierie des fonctionnalités : explorez des fonctionnalités supplémentaires susceptibles d'améliorer la précision du modèle.
- Déploiement dans le monde réel : déployez l'application sur des plateformes cloud comme AWS ou GCP pour une utilisation en production.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Python est plus facile à apprendre et à utiliser, tandis que C est plus puissant mais complexe. 1. La syntaxe Python est concise et adaptée aux débutants. Le typage dynamique et la gestion automatique de la mémoire le rendent facile à utiliser, mais peuvent entraîner des erreurs d'exécution. 2.C fournit des fonctionnalités de contrôle de bas niveau et avancées, adaptées aux applications haute performance, mais a un seuil d'apprentissage élevé et nécessite une gestion manuelle de la mémoire et de la sécurité.

Est-ce suffisant pour apprendre Python pendant deux heures par jour? Cela dépend de vos objectifs et de vos méthodes d'apprentissage. 1) Élaborer un plan d'apprentissage clair, 2) Sélectionnez les ressources et méthodes d'apprentissage appropriées, 3) la pratique et l'examen et la consolidation de la pratique pratique et de l'examen et de la consolidation, et vous pouvez progressivement maîtriser les connaissances de base et les fonctions avancées de Python au cours de cette période.

Python est meilleur que C dans l'efficacité du développement, mais C est plus élevé dans les performances d'exécution. 1. La syntaxe concise de Python et les bibliothèques riches améliorent l'efficacité du développement. Les caractéristiques de type compilation et le contrôle du matériel de CC améliorent les performances d'exécution. Lorsque vous faites un choix, vous devez peser la vitesse de développement et l'efficacité de l'exécution en fonction des besoins du projet.

Python et C ont chacun leurs propres avantages, et le choix doit être basé sur les exigences du projet. 1) Python convient au développement rapide et au traitement des données en raison de sa syntaxe concise et de son typage dynamique. 2) C convient à des performances élevées et à une programmation système en raison de son typage statique et de sa gestion de la mémoire manuelle.

PythonlistSaReparmentofthestandardLibrary, tandis que les coloccules de colocède, tandis que les colocculations pour la base de la Parlementaire, des coloments de forage polyvalent, tandis que la fonctionnalité de la fonctionnalité nettement adressée.

Python excelle dans l'automatisation, les scripts et la gestion des tâches. 1) Automatisation: La sauvegarde du fichier est réalisée via des bibliothèques standard telles que le système d'exploitation et la fermeture. 2) Écriture de script: utilisez la bibliothèque PSUTIL pour surveiller les ressources système. 3) Gestion des tâches: utilisez la bibliothèque de planification pour planifier les tâches. La facilité d'utilisation de Python et la prise en charge de la bibliothèque riche en font l'outil préféré dans ces domaines.

Les applications de Python en informatique scientifique comprennent l'analyse des données, l'apprentissage automatique, la simulation numérique et la visualisation. 1.Numpy fournit des tableaux multidimensionnels et des fonctions mathématiques efficaces. 2. Scipy étend la fonctionnalité Numpy et fournit des outils d'optimisation et d'algèbre linéaire. 3. Pandas est utilisé pour le traitement et l'analyse des données. 4.Matplotlib est utilisé pour générer divers graphiques et résultats visuels.

Les applications clés de Python dans le développement Web incluent l'utilisation des cadres Django et Flask, le développement de l'API, l'analyse et la visualisation des données, l'apprentissage automatique et l'IA et l'optimisation des performances. 1. Framework Django et Flask: Django convient au développement rapide d'applications complexes, et Flask convient aux projets petits ou hautement personnalisés. 2. Développement de l'API: Utilisez Flask ou DjangorestFramework pour construire RestulAPI. 3. Analyse et visualisation des données: utilisez Python pour traiter les données et les afficher via l'interface Web. 4. Apprentissage automatique et AI: Python est utilisé pour créer des applications Web intelligentes. 5. Optimisation des performances: optimisée par la programmation, la mise en cache et le code asynchrones
