Dieser Artikel vermittelt Ihnen relevantes Wissen über Python. Er stellt detailliert vor, wie Sie die Python-Sprache verwenden, um Funktionen zum automatischen Herunterladen von E-Mails und zum Parsen von Anhängen zu realisieren. Ich hoffe, es wird für alle hilfreich sein.
[Verwandte Empfehlung: Python3-Video-Tutorial]
Bevor wir mit dem Codieren beginnen, wollen wir zunächst die drei Mail-Service-Protokolle verstehen:
1. SMTP-Protokoll
SMTP (Simple Mail Transfer Protocol), das Einfaches Mail-Transfer-Protokoll. Sie entspricht einer Übergabestation und versendet E-Mails an den Client.
2. POP3-Protokoll
POP3 (Post Office Protocol 3), die dritte Version des Post-Office-Protokolls, ist der erste Offline-Protokollstandard für E-Mail. Dieses Protokoll lädt E-Mails auf den lokalen Computer herunter und synchronisiert sie nicht mit dem Server. Der Nachteil besteht darin, dass es wahrscheinlicher ist, dass E-Mails verloren gehen oder dieselben E-Mails mehrmals heruntergeladen werden.
3. IMAP-Protokoll
IMAP (Internet Mail Access Protocol), das interaktive E-Mail-Zugriffsprotokoll. Dieses Protokoll stellt für den direkten Betrieb eine Verbindung zu Remote-Postfächern her und synchronisiert Inhalte mit dem Server.
Dann stellen wir das E-Mail-Paket vor
Die zentrale Komponente dieses Pakets ist das „Objektmodell“, das E-Mail-Nachrichten darstellt. Anwendungen interagieren mit diesem Paket hauptsächlich über die im Nachrichtensubmodul definierte Objektmodellschnittstelle. Anwendungen können diese API verwenden, um Fragen zu vorhandenen E-Mails zu stellen, neue E-Mails zu erstellen oder E-Mail-Unterkomponenten hinzuzufügen oder zu entfernen, die selbst dieselbe Objektmodellschnittstelle verwenden. Das heißt, entsprechend der Natur von E-Mail-Nachrichten und ihren MIME-Unterkomponenten ist das E-Mail-Objektmodell eine Baumstruktur aller Objekte, die die EmailMessage-API bereitstellen.
Als nächstes verwenden wir spezifischen Code, um die Funktionen der Anmeldung beim E-Mail-Client, des Herunterladens von E-Mails und des Parsens des Inhalts von E-Mail-Anhängen zu implementieren.
Zuerst müssen wir eine E-Mail-Parsing-Klasse definieren, die drei Variablen erfordert:
1 Die E-Mail-Adresse, zu der die E-Mail gehört;
3 erfordern andere Sicherheitsrichtlinien, zum Beispiel erfordert das QQ-Postfach eine SMS-Überprüfung und erhält den Anmeldeautorisierungscode anstelle des Klartextkennworts, um sich beim Remote-Client anzumelden , und erhalten Sie standardmäßig alle E-Mails auf der ersten Seite. Wir erhalten den Betreff der E-Mail und drucken ihn aus [Die Codierung verschiedener E-Mail-Betreffer kann unterschiedlich sein, und die Binärdatei muss transcodiert werden, um korrekt angezeigt zu werden]
class Email_parse: def __init__(self,remote_server_url,email_url,password): # imap服务地址 self.remote_server_url = remote_server_url # 邮箱账号 self.email_url = email_url # 邮箱密码 self.password = password
Unter anderem speichert die msg-Variable den Text der E-Mail, weil msg und Tilt werden wiederverwendet, wir werden eine Klassenfunktion erstellen, um msg und title zurückzugeben.
def main_parse_Email(self): """入口函数,登录imap服务""" server = imaplib.IMAP4_SSL(self.remote_server_url, 993) server.login(self.email_url, self.password) server.select('INBOX') status,data = server.search(None,"ALL") if status != 'OK': raise Exception('read email error') emailids = data[0].split() mail_counts = len(emailids) print("count:",mail_counts) # 邮件的遍历是按时间从后往前,这里我们选择最新的一封邮件 for i in range(mail_counts - 1, mail_counts - 2, -1): status, edata = server.fetch(emailids[i], '(RFC822)') msg = email.message_from_bytes(edata[0][1]) #获取邮件主题title subject = email.header.decode_header(msg.get('subject')) if type(subject[-1][0]) == bytes: title = subject[-1][0].decode(str(subject[-1][1])) elif type(subject[-1][0]) == str: title = subject[-1][0] print("title:", title)
Beim Parsen der E-Mail teilen wir sie in zwei Teile, den E-Mail-Text [HTML] und den Anhang [xlsx usw.]. Wenn wir feststellen, dass ein Anhang vorhanden ist, speichern wir ihn in einem festen Pfad. Ich werde nicht näher auf das Parsen der Tabelle eingehen. Pakete wie Pandas reichen aus, um damit umzugehen.
def get_email_title(msg): subject = email.header.decode_header(msg.get('subject')) if type(subject[-1][0]) == bytes: title = subject[-1][0].decode(str(subject[-1][1])) elif type(subject[-1][0]) == str: title = subject[-1][0] print("title:", title) return title
Für den Inhalt des E-Mail-Textes analysieren wir direkt den HTML-Code und speichern den Textinhalt direkt in einer TXT-Datei, um das Lesen zu erleichtern.
def get_att(msg): """获取附件并下载""" filename = Email_parse.get_email_name(msg) for part in msg.walk(): file_name = part.get_param("name") if file_name: data = part.get_payload(decode=True) if data != None: att_file = open('./src/' + filename, 'wb') att_file.write(data) att_file.close() else: pass
Der vollständige Code lautet wie folgt:
def get_text_from_HTML(msg): """获取邮件中的html""" filename = Email_parse.get_email_name(msg) current_title = Email_parse.get_email_title(msg) print("filename:",filename,type(filename)) for part in msg.walk(): if not part.is_multipart(): result = part.get_payload(decode=True) result = result.decode('gbk') f = open(f'./src/{current_title}.txt','w') f.write(result) f.close() return result
Laufende Ergebnisse:
[Verwandte Empfehlungen:Python3-Video-Tutorial ]
Das obige ist der detaillierte Inhalt vonStellen Sie kurz das Beispiel des automatischen Herunterladens von E-Mails in Python vor. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!