在 Django 專案中實現具有 Levenshtein Distance 的詐欺偵測系統-Python教學-PHP中文網

首頁

後端開發

Python教學

在 Django 專案中實現具有 Levenshtein Distance 的詐欺偵測系統

Nov 07, 2024 pm 08:59 PM

Implémentation d

編輯距離可用於詐欺偵測系統，將使用者輸入的資料（例如姓名、地址或電子郵件）與現有資料進行比較，以識別相似但可能具有詐騙的條目。

這是將此功能整合到 Django 專案中的逐步指南。

1. 用例

詐欺偵測系統可以比較：

類似電子郵件：偵測建立時略有不同的帳戶（例如，user@example.com 與 userr@example.com）。
鄰近位址：檢查多個帳戶是否使用幾乎相同的位址。
相似名稱：發現名稱稍有修改的使用者（例如，John Doe 與 Jon Doe）。

2. 實施步驟

a.建立中間件或訊號來分析資料

使用 Django 的訊號在註冊或更新時檢查新使用者資料。

b.安裝編輯運算功能

整合函式庫來計算 Levenshtein 距離或使用以下 Python 函數：

from django.db.models import Q
from .models import User  # Assume User is your user model

def levenshtein_distance(a, b):
    n, m = len(a), len(b)
    if n &gt; m:
        a, b = b, a
        n, m = m, n

    current_row = range(n + 1)  # Keep current and previous row
    for i in range(1, m + 1):
        previous_row, current_row = current_row, [i] + [0] * n
        for j in range(1, n + 1):
            add, delete, change = previous_row[j] + 1, current_row[j - 1] + 1, previous_row[j - 1]
            if a[j - 1] != b[i - 1]:
                change += 1
            current_row[j] = min(add, delete, change)

    return current_row[n]

登入後複製

c.新增詐欺偵測功能

在您的訊號或中介軟體中，將輸入的資料與資料庫中的資料進行比較，以查找相似的條目。

from django.db.models import Q
from .models import User  # Assume User is your user model

def detect_similar_entries(email, threshold=2):
    users = User.objects.filter(~Q(email=email))  # Exclure l'utilisateur actuel
    similar_users = []

    for user in users:
        distance = levenshtein_distance(email, user.email)
        if distance &lt;= threshold:
            similar_users.append((user, distance))

    return similar_users

登入後複製

d.連接到使用者的 Signal post_save

在使用者註冊或更新後使用 post_save 訊號執行此檢查：

from django.db.models.signals import post_save
from django.dispatch import receiver
from .models import User
from .utils import detect_similar_entries  # Import your function

@receiver(post_save, sender=User)
def check_for_fraud(sender, instance, **kwargs):
    similar_users = detect_similar_entries(instance.email)

    if similar_users:
        print(f"Potential fraud detected for {instance.email}:")
        for user, distance in similar_users:
            print(f" - Similar email: {user.email}, Distance: {distance}")

登入後複製

e.選項：新增詐欺日誌範本

要追蹤可疑的詐騙行為，您可以建立 FraudLog 模型：

from django.db import models
from django.contrib.auth.models import User

class FraudLog(models.Model):
    suspicious_user = models.ForeignKey(User, related_name='suspicious_logs', on_delete=models.CASCADE)
    similar_user = models.ForeignKey(User, related_name='similar_logs', on_delete=models.CASCADE)
    distance = models.IntegerField()
    created_at = models.DateTimeField(auto_now_add=True)

登入後複製

在此範本中儲存可疑符合項目：

from django.db.models import Q
from .models import User  # Assume User is your user model

def levenshtein_distance(a, b):
    n, m = len(a), len(b)
    if n &gt; m:
        a, b = b, a
        n, m = m, n

    current_row = range(n + 1)  # Keep current and previous row
    for i in range(1, m + 1):
        previous_row, current_row = current_row, [i] + [0] * n
        for j in range(1, n + 1):
            add, delete, change = previous_row[j] + 1, current_row[j - 1] + 1, previous_row[j - 1]
            if a[j - 1] != b[i - 1]:
                change += 1
            current_row[j] = min(add, delete, change)

    return current_row[n]

登入後複製