Rumah > pembangunan bahagian belakang > Tutorial Python > Adakah E-mel Pemasaran Anda Akan Berakhir dalam Spam? Kami Membina Alat untuk Mengetahui

Adakah E-mel Pemasaran Anda Akan Berakhir dalam Spam? Kami Membina Alat untuk Mengetahui

Susan Sarandon
Lepaskan: 2024-12-31 09:47:10
asal
186 orang telah melayarinya

Apabila menjalankan kempen pemasaran e-mel, salah satu cabaran terbesar ialah memastikan mesej anda sampai ke peti masuk dan bukannya folder spam.

Dalam siaran ini, kami akan membina alat yang boleh mengesahkan sama ada e-mel anda akan ditandakan sebagai spam dan sebab ia ditandakan sedemikian.
Alat ini akan berada dalam bentuk API dan digunakan dalam talian, supaya ia boleh disepadukan ke dalam aliran kerja anda.

Rahsia Disebalik Pengesahan Spam

Apache SpamAssassin ialah platform pengesanan spam sumber terbuka yang diselenggarakan oleh Apache Software Foundation, yang merupakan alat yang digunakan secara meluas untuk banyak klien e-mel dan alat penapisan e-mel untuk mengklasifikasikan mesej sebagai spam.

Ia menggunakan pelbagai peraturan, penapisan Bayesian dan ujian rangkaian untuk menetapkan "skor" spam kepada e-mel yang diberikan. Secara amnya, e-mel yang mendapat markah 5 atau ke atas berisiko tinggi dibenderakan sebagai spam.

Memandangkan Apache SpamAssassin ialah perisian pengesanan spam, ia juga boleh digunakan untuk mengetahui sama ada e-mel anda akan dibenderakan sebagai spam.

Pemarkahan SpamAssassin adalah telus dan didokumentasikan dengan baik, anda dengan yakin boleh menggunakannya untuk mengenal pasti dengan tepat aspek e-mel anda yang menyebabkan skor spam yang tinggi dan meningkatkan penulisan anda.

Cara Mengesahkan E-mel Anda Menggunakan SpamAssassin

SpamAssassin direka untuk dijalankan pada sistem Linux. Anda memerlukan OS Linux atau mencipta bekas Docker untuk memasang dan menjalankannya.

Pada sistem Debian atau Ubuntu, pasang SpamAssassin dengan:

apt-get update && apt-get install -y spamassassin
sa-update
Salin selepas log masuk
Salin selepas log masuk

Arahan sa-kemas kini memastikan bahawa peraturan SpamAssassin adalah terkini.

Setelah dipasang, anda boleh menghantar mesej e-mel ke alat baris arahan SpamAssassin. Outputnya termasuk versi e-mel beranotasi dengan skor spam dan menerangkan peraturan yang dicetuskan.

Penggunaan biasa mungkin kelihatan seperti ini:

spamassassin -t < input_email.txt > results.txt
Salin selepas log masuk
Salin selepas log masuk

results.txt kemudiannya akan mengandungi e-mel yang diproses dengan pengepala dan markah SpamAssassin, seperti di bawah:

X-Spam-Checker-Version: SpamAssassin 4.0.0 (2022-12-13) on 254.254.254.254
X-Spam-Level: 
X-Spam-Status: No, score=0.2 required=5.0 tests=HTML_MESSAGE,
    MIME_HTML_ONLY,MISSING_MID,NO_RECEIVED,
    NO_RELAYS autolearn=no autolearn_force=no version=4.0.0

// ...

Content analysis details:   (0.2 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 0.1 MISSING_MID            Missing Message-Id: header
-0.0 NO_RECEIVED            Informational: message has no Received headers
-0.0 NO_RELAYS              Informational: message was not relayed via SMTP
 0.0 HTML_MESSAGE           BODY: HTML included in message
 0.1 MIME_HTML_ONLY         BODY: Message only has text/html MIME parts
Salin selepas log masuk
Salin selepas log masuk

Balut SpamAssassin sebagai API

SpamAssassin mencapai potensi maksimumnya hanya apabila dikapsulkan sebagai API, kerana borang ini menjadikannya lebih fleksibel dan membolehkan penyepaduan ke dalam pelbagai aliran kerja.

Bayangkan ini: sebelum anda menekan "Hantar" pada e-mel anda, kandungan dihantar terlebih dahulu ke API SpamAssassin. Hanya jika ia menentukan bahawa e-mel tidak memenuhi kriteria spam, ia dibenarkan untuk diteruskan.

Mari buat API mudah yang menerima medan e-mel ini: subjek, html_body dan text_body. Ia akan menghantar medan kepada SpamAssassin dan mengembalikan hasil pengesahan.

Contoh API

from fastapi import FastAPI
from datetime import datetime, timezone
from email.utils import format_datetime
from pydantic import BaseModel
import subprocess

def extract_analysis_details(text):
    lines = text.splitlines()

    start_index = None
    for i, line in enumerate(lines):
        if line.strip().startswith("pts rule"):
            start_index = i
            break

    if start_index is None:
        print("No content analysis details found.")
        return []

    data_lines = lines[start_index+2:]
    parsed_lines = []
    for line in data_lines:
        if line.strip() == "":
            break
        parsed_lines.append(line)

    results = []
    current_entry = None

    split_line = lines[start_index+1]
    pts_split, rule_split, *rest = split_line.strip().split(" ")

    pts_start = 0
    pts_end = pts_start + len(pts_split)

    rule_start = pts_end + 1
    rule_end = rule_start + len(rule_split)

    desc_start = rule_end + 1

    for line in parsed_lines:
        pts_str = line[pts_start:pts_end].strip()
        rule_name_str = line[rule_start:rule_end].strip()
        description_str = line[desc_start:].strip()

        if pts_str == "" and rule_name_str == "" and description_str:
            if current_entry:
                current_entry["description"] += " " + description_str
        else:
            current_entry = {
                "pts": pts_str,
                "rule_name": rule_name_str,
                "description": description_str
            }
            results.append(current_entry)

    return results

app = FastAPI()

class Email(BaseModel):
    subject: str
    html_body: str
    text_body: str

@app.post("/spam_check")
def spam_check(email: Email):
    # assemble the full email
    message = f"""From: example@example.com
To: recipient@example.com
Subject: {email.subject}
Date: {format_datetime(datetime.now(timezone.utc))}
MIME-Version: 1.0
Content-Type: multipart/alternative; boundary="__SPAM_ASSASSIN_BOUNDARY__"

--__SPAM_ASSASSIN_BOUNDARY__
Content-Type: text/plain; charset="utf-8"

{email.text_body}

--__SPAM_ASSASSIN_BOUNDARY__
Content-Type: text/html; charset="utf-8"

{email.html_body}

--__SPAM_ASSASSIN_BOUNDARY__--"""

    # Run SpamAssassin and capture the output directly
    output = subprocess.run(["spamassassin", "-t"],
                            input=message.encode('utf-8'),
                            capture_output=True)

    output_str = output.stdout.decode('utf-8', errors='replace')
    details = extract_analysis_details(output_str)
    return {"result": details}
Salin selepas log masuk
Salin selepas log masuk

Dalam kod di atas, kami menentukan fungsi pembantu, extract_analysis_details, untuk mengekstrak hanya sebab pemarkahan daripada laporan hasil penuh. Anda boleh menambah baik lagi fungsi ini, contohnya, dengan menapis peraturan tertentu daripada hasilnya.

Respons akan mengandungi butiran analisis keputusan SpamAssassin.

Mari kita ambil input ini sebagai contoh:

subjek

apt-get update && apt-get install -y spamassassin
sa-update
Salin selepas log masuk
Salin selepas log masuk

html_body

spamassassin -t < input_email.txt > results.txt
Salin selepas log masuk
Salin selepas log masuk

badan_teks

X-Spam-Checker-Version: SpamAssassin 4.0.0 (2022-12-13) on 254.254.254.254
X-Spam-Level: 
X-Spam-Status: No, score=0.2 required=5.0 tests=HTML_MESSAGE,
    MIME_HTML_ONLY,MISSING_MID,NO_RECEIVED,
    NO_RELAYS autolearn=no autolearn_force=no version=4.0.0

// ...

Content analysis details:   (0.2 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 0.1 MISSING_MID            Missing Message-Id: header
-0.0 NO_RECEIVED            Informational: message has no Received headers
-0.0 NO_RELAYS              Informational: message was not relayed via SMTP
 0.0 HTML_MESSAGE           BODY: HTML included in message
 0.1 MIME_HTML_ONLY         BODY: Message only has text/html MIME parts
Salin selepas log masuk
Salin selepas log masuk

Responsnya adalah seperti ini:

from fastapi import FastAPI
from datetime import datetime, timezone
from email.utils import format_datetime
from pydantic import BaseModel
import subprocess

def extract_analysis_details(text):
    lines = text.splitlines()

    start_index = None
    for i, line in enumerate(lines):
        if line.strip().startswith("pts rule"):
            start_index = i
            break

    if start_index is None:
        print("No content analysis details found.")
        return []

    data_lines = lines[start_index+2:]
    parsed_lines = []
    for line in data_lines:
        if line.strip() == "":
            break
        parsed_lines.append(line)

    results = []
    current_entry = None

    split_line = lines[start_index+1]
    pts_split, rule_split, *rest = split_line.strip().split(" ")

    pts_start = 0
    pts_end = pts_start + len(pts_split)

    rule_start = pts_end + 1
    rule_end = rule_start + len(rule_split)

    desc_start = rule_end + 1

    for line in parsed_lines:
        pts_str = line[pts_start:pts_end].strip()
        rule_name_str = line[rule_start:rule_end].strip()
        description_str = line[desc_start:].strip()

        if pts_str == "" and rule_name_str == "" and description_str:
            if current_entry:
                current_entry["description"] += " " + description_str
        else:
            current_entry = {
                "pts": pts_str,
                "rule_name": rule_name_str,
                "description": description_str
            }
            results.append(current_entry)

    return results

app = FastAPI()

class Email(BaseModel):
    subject: str
    html_body: str
    text_body: str

@app.post("/spam_check")
def spam_check(email: Email):
    # assemble the full email
    message = f"""From: example@example.com
To: recipient@example.com
Subject: {email.subject}
Date: {format_datetime(datetime.now(timezone.utc))}
MIME-Version: 1.0
Content-Type: multipart/alternative; boundary="__SPAM_ASSASSIN_BOUNDARY__"

--__SPAM_ASSASSIN_BOUNDARY__
Content-Type: text/plain; charset="utf-8"

{email.text_body}

--__SPAM_ASSASSIN_BOUNDARY__
Content-Type: text/html; charset="utf-8"

{email.html_body}

--__SPAM_ASSASSIN_BOUNDARY__--"""

    # Run SpamAssassin and capture the output directly
    output = subprocess.run(["spamassassin", "-t"],
                            input=message.encode('utf-8'),
                            capture_output=True)

    output_str = output.stdout.decode('utf-8', errors='replace')
    details = extract_analysis_details(output_str)
    return {"result": details}
Salin selepas log masuk
Salin selepas log masuk

Nampak? "Pemenang yang dihormati" dikesan kerana ia biasanya digunakan dalam e-mel spam.

Menggunakan API Dalam Talian

Menjalankan SpamAssassin memerlukan persekitaran Linux dengan perisian dipasang. Secara tradisinya, anda mungkin memerlukan contoh EC2 atau titisan DigitalOcean untuk digunakan, yang boleh memakan kos dan membosankan, terutamanya jika penggunaan anda adalah volum rendah.

Bagi platform tanpa pelayan, mereka hanya tidak membenarkan anda memasang sebarang pakej sistem seperti SpamAssassin.

Leapcell boleh mengendalikan kerja ini dengan sempurna.

Dengan Leapcell, anda boleh menggunakan mana-mana pakej sistem seperti SpamAssassin, sementara itu mengekalkan perkhidmatan tanpa pelayan - anda hanya membayar untuk invokasi, yang biasanya lebih murah.

Menggunakan API pada Leapcell adalah sangat mudah. Anda tidak perlu menyediakan sebarang persekitaran. Hanya gunakan imej Python dan isi medan "Bina Perintah" dengan betul.

Will Your Marketing Email End Up in Spam? We Built a Tool to Find Out

Setelah digunakan, anda akan mempunyai api untuk pengesahan spam. Setiap kali API digunakan, ia akan menjalankan SpamAssassin, menjaringkan e-mel dan mengembalikan skor.

Will Your Marketing Email End Up in Spam? We Built a Tool to Find Out

Baca di blog kami

Atas ialah kandungan terperinci Adakah E-mel Pemasaran Anda Akan Berakhir dalam Spam? Kami Membina Alat untuk Mengetahui. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan