Implementierung eines Betrugserkennungssystems mit Levenshtein Distance in einem Django-Projekt

Mary-Kate Olsen
Freigeben: 2024-11-07 20:59:02
Original
348 Leute haben es durchsucht

Implémentation d

Levenshtein-Distanz kann in einem Betrugserkennungssystem verwendet werden, um vom Benutzer eingegebene Daten (wie Name, Adresse oder E-Mail) mit vorhandenen Daten zu vergleichen, um ähnliche, aber potenziell betrügerische Eingaben zu identifizieren.

Hier finden Sie eine Schritt-für-Schritt-Anleitung zur Integration dieser Funktionalität in Ihr Django-Projekt.


1. Anwendungsfall

Ein Betrugserkennungssystem kann Folgendes vergleichen:

  • Ähnliche E-Mails: um Konten zu erkennen, die mit geringfügigen Abweichungen erstellt wurden (z. B. user@example.com vs. userr@example.com).
  • Nahezu Adressen: Um zu prüfen, ob mehrere Konten nahezu identische Adressen verwenden.
  • Ähnliche Namen: um Benutzer mit leicht veränderten Namen zu erkennen (z. B. John Doe vs. Jon Doe).

2. Schritte zur Umsetzung

a. Erstellen Sie Middleware oder Signal zur Datenanalyse

Verwenden Sie Djangos Signale, um zum Zeitpunkt der Registrierung oder Aktualisierung nach neuen Benutzerdaten zu suchen.

b. Installieren Sie eine Levenshtein-Berechnungsfunktion

Integrieren Sie eine Bibliothek zur Berechnung der Levenshtein-Distanz oder verwenden Sie eine Python-Funktion wie diese:

from django.db.models import Q
from .models import User  # Assume User is your user model

def levenshtein_distance(a, b):
    n, m = len(a), len(b)
    if n > m:
        a, b = b, a
        n, m = m, n

    current_row = range(n + 1)  # Keep current and previous row
    for i in range(1, m + 1):
        previous_row, current_row = current_row, [i] + [0] * n
        for j in range(1, n + 1):
            add, delete, change = previous_row[j] + 1, current_row[j - 1] + 1, previous_row[j - 1]
            if a[j - 1] != b[i - 1]:
                change += 1
            current_row[j] = min(add, delete, change)

    return current_row[n]
Nach dem Login kopieren
Nach dem Login kopieren

c. Fügen Sie eine Betrugserkennungsfunktion hinzu

Vergleichen Sie in Ihrem Signal oder Ihrer Middleware die eingegebenen Daten mit denen in der Datenbank, um ähnliche Einträge zu finden.

from django.db.models import Q
from .models import User  # Assume User is your user model

def detect_similar_entries(email, threshold=2):
    users = User.objects.filter(~Q(email=email))  # Exclure l'utilisateur actuel
    similar_users = []

    for user in users:
        distance = levenshtein_distance(email, user.email)
        if distance <= threshold:
            similar_users.append((user, distance))

    return similar_users
Nach dem Login kopieren

d. Stellen Sie eine Verbindung zu Signal post_save für Benutzer her

Verwenden Sie das Signal post_save, um diese Prüfung auszuführen, nachdem sich ein Benutzer registriert oder aktualisiert hat:

from django.db.models.signals import post_save
from django.dispatch import receiver
from .models import User
from .utils import detect_similar_entries  # Import your function

@receiver(post_save, sender=User)
def check_for_fraud(sender, instance, **kwargs):
    similar_users = detect_similar_entries(instance.email)

    if similar_users:
        print(f"Potential fraud detected for {instance.email}:")
        for user, distance in similar_users:
            print(f" - Similar email: {user.email}, Distance: {distance}")
Nach dem Login kopieren

z.B. Option: Fügen Sie eine Betrugsprotokollvorlage hinzu

Um mutmaßlichen Betrug zu verfolgen, können Sie ein FraudLog-Modell erstellen:

from django.db import models
from django.contrib.auth.models import User

class FraudLog(models.Model):
    suspicious_user = models.ForeignKey(User, related_name='suspicious_logs', on_delete=models.CASCADE)
    similar_user = models.ForeignKey(User, related_name='similar_logs', on_delete=models.CASCADE)
    distance = models.IntegerField()
    created_at = models.DateTimeField(auto_now_add=True)
Nach dem Login kopieren

Speichern Sie verdächtige Übereinstimmungen in dieser Vorlage:

from django.db.models import Q
from .models import User  # Assume User is your user model

def levenshtein_distance(a, b):
    n, m = len(a), len(b)
    if n > m:
        a, b = b, a
        n, m = m, n

    current_row = range(n + 1)  # Keep current and previous row
    for i in range(1, m + 1):
        previous_row, current_row = current_row, [i] + [0] * n
        for j in range(1, n + 1):
            add, delete, change = previous_row[j] + 1, current_row[j - 1] + 1, previous_row[j - 1]
            if a[j - 1] != b[i - 1]:
                change += 1
            current_row[j] = min(add, delete, change)

    return current_row[n]
Nach dem Login kopieren
Nach dem Login kopieren

3. Verbesserungen und Optimierungen

a. Vergleiche einschränken

  • Vergleichen Sie nur aktuelle Benutzer oder solche aus derselben Region, demselben Unternehmen usw.

b. Schwellenwert anpassen

  • Legen Sie je nach Feld einen anderen Schwellenwert für akzeptable Entfernungen fest (z. B. einen Schwellenwert von 1 für E-Mails und 2 für Namen).

c. Verwendung fortschrittlicher Algorithmen

  • Entdecken Sie Bibliotheken wie RapidFuzz für optimierte Berechnungen.

d. Integration in Django Admin

  • Fügen Sie in der Admin-Oberfläche Benachrichtigungen für Benutzer mit potenziellem Betrugsrisiko hinzu.

4. Fazit

Mit diesem Ansatz haben Sie ein Betrugserkennungssystem basierend auf der Levenshtein-Distanz implementiert. Es hilft, ähnliche Einträge zu identifizieren und verringert so das Risiko, betrügerische Konten zu erstellen oder Daten zu duplizieren. Dieses System ist erweiterbar und kann an die spezifischen Anforderungen Ihres Projekts angepasst werden.

Das obige ist der detaillierte Inhalt vonImplementierung eines Betrugserkennungssystems mit Levenshtein Distance in einem Django-Projekt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:dev.to
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage