使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统-Python教程-PHP中文网

首页

后端开发

Python教程

使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统

王林

Aug 13, 2024 am 06:54 AM

Building a Real-Time Credit Card Fraud Detection System with FastAPI and Machine Learning

介绍

信用卡欺诈对金融业构成重大威胁，每年造成数十亿美元的损失。为了解决这个问题，人们开发了机器学习模型来实时检测和防止欺诈交易。在本文中，我们将逐步介绍使用 FastAPI（Python 的现代 Web 框架）以及在 Kaggle 流行的信用卡欺诈检测数据集上训练的随机森林分类器构建实时信用卡欺诈检测系统的过程。

项目概况

该项目的目标是创建一个 Web 服务来预测信用卡交易欺诈的可能性。该服务接受交易数据，对其进行预处理，然后返回预测以及欺诈概率。该系统设计快速、可扩展，并且易于集成到现有的金融系统中。

关键部件

机器学习模型：经过训练以区分欺诈交易和合法交易的随机森林分类器。
数据预处理：交易特征标准化，确保模型达到最佳性能。
API：使用 FastAPI 构建的 RESTful API，用于实时处理预测请求。

第 1 步：准备数据集

本项目使用的数据集是来自 Kaggle 的信用卡欺诈检测数据集，其中包含 284,807 笔交易，其中只有 492 笔是欺诈交易。这种类别不平衡带来了挑战，但可以通过对少数类别进行过采样来解决。

数据预处理

这些功能首先使用 scikit-learn 的 StandardScaler 进行标准化。然后将数据集分为训练集和测试集。鉴于不平衡，在训练模型之前应用 RandomOverSampler 技术来平衡类别。

from sklearn.preprocessing import StandardScaler
from imblearn.over_sampling import RandomOverSampler

# Standardize features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Balance the dataset
ros = RandomOverSampler(random_state=42)
X_resampled, y_resampled = ros.fit_resample(X_scaled, y)

登录后复制

第 2 步：训练机器学习模型

我们训练了一个随机森林分类器，它非常适合处理不平衡的数据集并提供可靠的预测。该模型在过采样数据上进行训练，并使用准确度、精确度、召回率和 AUC-ROC 曲线来评估其性能。

from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, roc_auc_score

# Train the model
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_resampled, y_resampled)

# Evaluate the model
y_pred = model.predict(X_test_scaled)
print(classification_report(y_test, y_pred))
print("AUC-ROC:", roc_auc_score(y_test, model.predict_proba(X_test_scaled)[:, 1]))

登录后复制

第 3 步：构建 FastAPI 应用程序

使用 joblib 保存训练好的模型和缩放器后，我们继续构建 FastAPI 应用程序。选择 FastAPI 是因为其速度快且易于使用，使其成为实时应用程序的理想选择。

创建 API

FastAPI 应用程序定义了一个 POST 端点 /predict/，它接受交易数据、对其进行处理并返回模型的预测和概率。

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
import joblib
import pandas as pd

# Load the trained model and scaler
model = joblib.load("random_forest_model.pkl")
scaler = joblib.load("scaler.pkl")

app = FastAPI()

class Transaction(BaseModel):
    V1: float
    V2: float
    # Include all other features used in your model
    Amount: float

@app.post("/predict/")
def predict(transaction: Transaction):
    try:
        data = pd.DataFrame([transaction.dict()])
        scaled_data = scaler.transform(data)
        prediction = model.predict(scaled_data)
        prediction_proba = model.predict_proba(scaled_data)
        return {"fraud_prediction": int(prediction[0]), "probability": float(prediction_proba[0][1])}
    except Exception as e:
        raise HTTPException(status_code=400, detail=str(e))

登录后复制

第 4 步：部署应用程序

要在本地测试应用程序，您可以使用 uvicorn 运行 FastAPI 服务器并向 /predict/ 端点发送 POST 请求。该服务将处理传入请求、扩展数据并返回交易是否存在欺诈。

本地运行 API

uvicorn main:app --reload

登录后复制

然后您可以使用curl 或Postman 等工具测试API：

curl -X POST http://127.0.0.1:8000/predict/ \
-H "Content-Type: application/json" \
-d '{"V1": -1.359807134, "V2": -0.072781173, ..., "Amount": 149.62}'

登录后复制

API 将返回一个 JSON 对象，其中包含欺诈预测和相关概率。

结论

在本文中，我们构建了一个实时信用卡欺诈检测系统，该系统将机器学习与现代 Web 框架相结合。 github 链接在这里。该系统旨在处理实时交易数据并提供即时预测，使其成为金融机构打击欺诈的宝贵工具。

通过使用 FastAPI 部署此模型，我们确保服务不仅快速而且可扩展，能够同时处理多个请求。该项目可以通过更复杂的模型、改进的特征工程或与生产环境的集成来进一步扩展。

下一步

要进一步增强系统，请考虑以下事项：

模型改进：尝试更高级的模型，如 XGBoost 或神经网络。
特征工程：探索可能提高模型准确性的其他功能。
实际部署：在 AWS 或 GCP 等云平台上部署应用程序以供生产使用。

以上是使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1675

CakePHP 教程

1429

Laravel 教程

1333

PHP教程

1278

C# 教程

1257

显示更多

Related knowledge

Python与C：学习曲线和易用性 Apr 19, 2025 am 12:20 AM

Python更易学且易用，C 则更强大但复杂。1.Python语法简洁，适合初学者，动态类型和自动内存管理使其易用，但可能导致运行时错误。2.C 提供低级控制和高级特性，适合高性能应用，但学习门槛高，需手动管理内存和类型安全。

学习Python：2小时的每日学习是否足够？ Apr 18, 2025 am 12:22 AM

每天学习Python两个小时是否足够？这取决于你的目标和学习方法。1)制定清晰的学习计划，2)选择合适的学习资源和方法，3)动手实践和复习巩固，可以在这段时间内逐步掌握Python的基本知识和高级功能。

Python vs.C：探索性能和效率 Apr 18, 2025 am 12:20 AM

Python在开发效率上优于C ，但C 在执行性能上更高。1.Python的简洁语法和丰富库提高开发效率。2.C 的编译型特性和硬件控制提升执行性能。选择时需根据项目需求权衡开发速度与执行效率。

Python vs. C：了解关键差异 Apr 21, 2025 am 12:18 AM

Python和C 各有优势，选择应基于项目需求。1)Python适合快速开发和数据处理，因其简洁语法和动态类型。2)C 适用于高性能和系统编程，因其静态类型和手动内存管理。

Python标准库的哪一部分是：列表或数组？ Apr 27, 2025 am 12:03 AM

pythonlistsarepartofthestAndArdLibrary，herilearRaysarenot.listsarebuilt-In，多功能，和Rused ForStoringCollections，而EasaraySaraySaraySaraysaraySaraySaraysaraySaraysarrayModuleandleandleandlesscommonlyusedDduetolimitedFunctionalityFunctionalityFunctionality。

Python：自动化，脚本和任务管理 Apr 16, 2025 am 12:14 AM

Python在自动化、脚本编写和任务管理中表现出色。1)自动化：通过标准库如os、shutil实现文件备份。2)脚本编写：使用psutil库监控系统资源。3)任务管理：利用schedule库调度任务。Python的易用性和丰富库支持使其在这些领域中成为首选工具。

科学计算的Python：详细的外观 Apr 19, 2025 am 12:15 AM

Python在科学计算中的应用包括数据分析、机器学习、数值模拟和可视化。1.Numpy提供高效的多维数组和数学函数。2.SciPy扩展Numpy功能，提供优化和线性代数工具。3.Pandas用于数据处理和分析。4.Matplotlib用于生成各种图表和可视化结果。

Web开发的Python：关键应用程序 Apr 18, 2025 am 12:20 AM

Python在Web开发中的关键应用包括使用Django和Flask框架、API开发、数据分析与可视化、机器学习与AI、以及性能优化。1.Django和Flask框架：Django适合快速开发复杂应用，Flask适用于小型或高度自定义项目。2.API开发：使用Flask或DjangoRESTFramework构建RESTfulAPI。3.数据分析与可视化：利用Python处理数据并通过Web界面展示。4.机器学习与AI：Python用于构建智能Web应用。5.性能优化：通过异步编程、缓存和代码优

See all articles

使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统

介绍

项目概况

关键部件

第 1 步：准备数据集

数据预处理

第 2 步：训练机器学习模型

第 3 步：构建 FastAPI 应用程序

创建 API

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题