Python이 이메일 데이터를 읽고 첨부 파일을 다운로드하는 방법에 대한 자세한 설명
Aug 03, 2017 pm 03:41 PM
python
데이터
우편
이 글에서는 Python이 이메일 데이터를 읽고 첨부 파일을 다운로드하는 예제에 대한 자세한 설명을 중심으로 관련 정보를 소개합니다. 이 부분의 내용을 모두가 배우고 이해할 수 있도록 구현 예제를 소개합니다.
이메일 읽기 Python 구현에 대한 자세한 설명 데이터 및 다운로드 첨부 예
구현 결과 다이어그램:
구현 코드:
#!/usr/bin/python2.7 # _*_ coding: utf-8 _*_ """ @Author: MarkLiu """ import poplib import email from email.parser import Parser from email.header import decode_header from email.utils import parseaddr def decode_str(s): value, charset = decode_header(s)[0] if charset: value = value.decode(charset) return value def guess_charset(msg): # 先从msg对象获取编码: charset = msg.get_charset() if charset is None: # 如果获取不到,再从Content-Type字段获取: content_type = msg.get('Content-Type', '').lower() pos = content_type.find('charset=') if pos >= 0: charset = content_type[pos + 8:].strip() return charset def get_email_headers(msg): # 邮件的From, To, Subject存在于根对象上: headers = {} for header in ['From', 'To', 'Subject', 'Date']: value = msg.get(header, '') if value: if header == 'Date': headers['date'] = value if header == 'Subject': # 需要解码Subject字符串: subject = decode_str(value) headers['subject'] = subject else: # 需要解码Email地址: hdr, addr = parseaddr(value) name = decode_str(hdr) value = u'%s <%s>' % (name, addr) if header == 'From': from_address = value headers['from'] = from_address else: to_address = value headers['to'] = to_address content_type = msg.get_content_type() print 'head content_type: ', content_type return headers # indent用于缩进显示: def get_email_cntent(message, base_save_path): j = 0 content = '' attachment_files = [] for part in message.walk(): j = j + 1 file_name = part.get_filename() contentType = part.get_content_type() # 保存附件 if file_name: # Attachment # Decode filename h = email.Header.Header(file_name) dh = email.Header.decode_header(h) filename = dh[0][0] if dh[0][1]: # 如果包含编码的格式,则按照该格式解码 filename = unicode(filename, dh[0][1]) filename = filename.encode("utf-8") data = part.get_payload(decode=True) att_file = open(base_save_path + filename, 'wb') attachment_files.append(filename) att_file.write(data) att_file.close() elif contentType == 'text/plain' or contentType == 'text/html': # 保存正文 data = part.get_payload(decode=True) charset = guess_charset(part) if charset: charset = charset.strip().split(';')[0] print 'charset:', charset data = data.decode(charset) content = data return content, attachment_files if __name__ == '__main__': # 输入邮件地址, 口令和POP3服务器地址: emailaddress = 'xxxxxx@163.com' # 注意使用开通POP,SMTP等的授权码 password = 'xxxxxx' pop3_server = 'pop.163.com' # 连接到POP3服务器: server = poplib.POP3(pop3_server) # 可以打开或关闭调试信息: # server.set_debuglevel(1) # POP3服务器的欢迎文字: print server.getwelcome() # 身份认证: server.user(emailaddress) server.pass_(password) # stat()返回邮件数量和占用空间: messagesCount, messagesSize = server.stat() print 'messagesCount:', messagesCount print 'messagesSize:', messagesSize # list()返回所有邮件的编号: resp, mails, octets = server.list() print '------ resp ------' print resp # +OK 46 964346 响应的状态 邮件数量 邮件占用的空间大小 print '------ mails ------' print mails # 所有邮件的编号及大小的编号list,['1 2211', '2 29908', ...] print '------ octets ------' print octets # 获取最新一封邮件, 注意索引号从1开始: length = len(mails) for i in range(length): resp, lines, octets = server.retr(i + 1) # lines存储了邮件的原始文本的每一行, # 可以获得整个邮件的原始文本: msg_content = '\n'.join(lines) # 把邮件内容解析为Message对象: msg = Parser().parsestr(msg_content) # 但是这个Message对象本身可能是一个MIMEMultipart对象,即包含嵌套的其他MIMEBase对象, # 嵌套可能还不止一层。所以我们要递归地打印出Message对象的层次结构: print '---------- 解析之后 ----------' base_save_path = '/media/markliu/Entertainment/email_attachments/' msg_headers = get_email_headers(msg) content, attachment_files = get_email_cntent(msg, base_save_path) print 'subject:', msg_headers['subject'] print 'from_address:', msg_headers['from'] print 'to_address:', msg_headers['to'] print 'date:', msg_headers['date'] print 'content:', content print 'attachment_files: ', attachment_files # 关闭连接: server.quit()
로그인 후 복사
위 내용은 Python이 이메일 데이터를 읽고 첨부 파일을 다운로드하는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

인기 기사
Repo : 팀원을 부활시키는 방법
3 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌
스플릿 소설을이기는 데 얼마나 걸립니까?
3 몇 주 전
By DDD
R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌
헬로 키티 아일랜드 어드벤처 : 거대한 씨앗을 얻는 방법
3 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌

인기 기사
Repo : 팀원을 부활시키는 방법
3 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌
스플릿 소설을이기는 데 얼마나 걸립니까?
3 몇 주 전
By DDD
R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌
헬로 키티 아일랜드 어드벤처 : 거대한 씨앗을 얻는 방법
3 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 기사 태그

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제
Gmail 이메일의 로그인 입구는 어디에 있나요?
7292
9


자바 튜토리얼
1622
14


Cakephp 튜토리얼
1342
46


라라벨 튜토리얼
1259
25


PHP 튜토리얼
1206
29



Google AI, 개발자를 위한 Gemini 1.5 Pro 및 Gemma 2 발표

70B 모델은 몇 초 안에 1,000개의 토큰을 생성하고 코드 재작성은 OpenAI가 투자한 코드 아티팩트인 Cursor 팀의 GPT-4o를 능가합니다.

AI 스타트업들이 집단적으로 OpenAI로 직무를 전환했고, Ilya가 떠난 후 보안팀이 재편성되었습니다!
