详解python实现读取邮件数据并下载附件的实例


Posted in Python onAugust 03, 2017

详解python实现读取邮件数据并下载附件的实例

实现结果图:

详解python实现读取邮件数据并下载附件的实例

实现代码:

#!/usr/bin/python2.7
# _*_ coding: utf-8 _*_

"""
@Author: MarkLiu
"""

import poplib
import email
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr


def decode_str(s):
  value, charset = decode_header(s)[0]
  if charset:
    value = value.decode(charset)
  return value


def guess_charset(msg):
  # 先从msg对象获取编码:
  charset = msg.get_charset()
  if charset is None:
    # 如果获取不到,再从Content-Type字段获取:
    content_type = msg.get('Content-Type', '').lower()
    pos = content_type.find('charset=')
    if pos >= 0:
      charset = content_type[pos + 8:].strip()
  return charset


def get_email_headers(msg):
  # 邮件的From, To, Subject存在于根对象上:
  headers = {}
  for header in ['From', 'To', 'Subject', 'Date']:
    value = msg.get(header, '')
    if value:
      if header == 'Date':
        headers['date'] = value
      if header == 'Subject':
        # 需要解码Subject字符串:
        subject = decode_str(value)
        headers['subject'] = subject
      else:
        # 需要解码Email地址:
        hdr, addr = parseaddr(value)
        name = decode_str(hdr)
        value = u'%s <%s>' % (name, addr)
        if header == 'From':
          from_address = value
          headers['from'] = from_address
        else:
          to_address = value
          headers['to'] = to_address
  content_type = msg.get_content_type()
  print 'head content_type: ', content_type
  return headers


# indent用于缩进显示:
def get_email_cntent(message, base_save_path):
  j = 0
  content = ''
  attachment_files = []
  for part in message.walk():
    j = j + 1
    file_name = part.get_filename()
    contentType = part.get_content_type()
    # 保存附件
    if file_name: # Attachment
      # Decode filename
      h = email.Header.Header(file_name)
      dh = email.Header.decode_header(h)
      filename = dh[0][0]
      if dh[0][1]: # 如果包含编码的格式,则按照该格式解码
        filename = unicode(filename, dh[0][1])
        filename = filename.encode("utf-8")
      data = part.get_payload(decode=True)
      att_file = open(base_save_path + filename, 'wb')
      attachment_files.append(filename)
      att_file.write(data)
      att_file.close()
    elif contentType == 'text/plain' or contentType == 'text/html':
      # 保存正文
      data = part.get_payload(decode=True)
      charset = guess_charset(part)
      if charset:
        charset = charset.strip().split(';')[0]
        print 'charset:', charset
        data = data.decode(charset)
      content = data
  return content, attachment_files


if __name__ == '__main__':
  # 输入邮件地址, 口令和POP3服务器地址:
  emailaddress = 'xxxxxx@163.com'
  # 注意使用开通POP,SMTP等的授权码
  password = 'xxxxxx'
  pop3_server = 'pop.163.com'

  # 连接到POP3服务器:
  server = poplib.POP3(pop3_server)
  # 可以打开或关闭调试信息:
  # server.set_debuglevel(1)
  # POP3服务器的欢迎文字:
  print server.getwelcome()
  # 身份认证:
  server.user(emailaddress)
  server.pass_(password)
  # stat()返回邮件数量和占用空间:
  messagesCount, messagesSize = server.stat()
  print 'messagesCount:', messagesCount
  print 'messagesSize:', messagesSize
  # list()返回所有邮件的编号:
  resp, mails, octets = server.list()
  print '------ resp ------'
  print resp # +OK 46 964346 响应的状态 邮件数量 邮件占用的空间大小
  print '------ mails ------'
  print mails # 所有邮件的编号及大小的编号list,['1 2211', '2 29908', ...]
  print '------ octets ------'
  print octets

  # 获取最新一封邮件, 注意索引号从1开始:
  length = len(mails)
  for i in range(length):
    resp, lines, octets = server.retr(i + 1)
    # lines存储了邮件的原始文本的每一行,
    # 可以获得整个邮件的原始文本:
    msg_content = '\n'.join(lines)
    # 把邮件内容解析为Message对象:
    msg = Parser().parsestr(msg_content)

    # 但是这个Message对象本身可能是一个MIMEMultipart对象,即包含嵌套的其他MIMEBase对象,
    # 嵌套可能还不止一层。所以我们要递归地打印出Message对象的层次结构:
    print '---------- 解析之后 ----------'
    base_save_path = '/media/markliu/Entertainment/email_attachments/'
    msg_headers = get_email_headers(msg)
    content, attachment_files = get_email_cntent(msg, base_save_path)

    print 'subject:', msg_headers['subject']
    print 'from_address:', msg_headers['from']
    print 'to_address:', msg_headers['to']
    print 'date:', msg_headers['date']
    print 'content:', content
    print 'attachment_files: ', attachment_files

  # 关闭连接:
  server.quit()

以上就是python读取邮件并下载邮件附件的实例,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python实现telnet服务器的方法
Jul 10 Python
详解如何利用Cython为Python代码加速
Jan 27 Python
Python获取CPU、内存使用率以及网络使用状态代码
Feb 08 Python
基于DataFrame筛选数据与loc的用法详解
May 18 Python
python常见字符串处理函数与用法汇总
Oct 30 Python
tensorflow实现打印ckpt模型保存下的变量名称及变量值
Jan 04 Python
Python3实现发送邮件和发送短信验证码功能
Jan 07 Python
python设置代理和添加镜像源的方法
Feb 14 Python
python 中的paramiko模块简介及安装过程
Feb 29 Python
python tkinter 设置窗口大小不可缩放实例
Mar 04 Python
windows支持哪个版本的python
Jul 03 Python
python实现图片九宫格分割的示例
Apr 25 Python
详解 Python中LEGB和闭包及装饰器
Aug 03 #Python
Python 爬虫之超链接 url中含有中文出错及解决办法
Aug 03 #Python
python中MethodType方法介绍与使用示例
Aug 03 #Python
初学python的操作难点总结(新手必看篇)
Aug 03 #Python
python 禁止函数修改列表的实现方法
Aug 03 #Python
详解Python函数可变参数定义及其参数传递方式
Aug 02 #Python
详解Python import方法引入模块的实例
Aug 02 #Python
You might like
使用php批量删除数据库下所有前缀为prefix_的表
2014/06/09 PHP
ThinkPHP连接数据库及主从数据库的设置教程
2014/08/22 PHP
JavaScript中获取未知对象属性的代码
2011/04/27 Javascript
AngularJS入门教程(零):引导程序
2014/12/06 Javascript
jQuery 遍历函数详解
2015/07/05 Javascript
jquery+html5时钟特效代码分享(可设置闹钟并且语音提醒)
2020/03/30 Javascript
SpringMVC restful 注解之@RequestBody进行json与object转换
2015/12/10 Javascript
对象题目的一个坑 理解Javascript对象
2015/12/22 Javascript
bootstrap模态框消失问题的解决方法
2016/12/02 Javascript
JavaScript简单实现合并两个Json对象的方法示例
2017/10/16 Javascript
angular2中使用第三方js库的实例
2018/02/26 Javascript
简单介绍react redux的中间件的使用
2018/04/06 Javascript
vuex操作state对象的实例代码
2018/04/25 Javascript
vue+element模态框中新增模态框和删除功能
2019/06/11 Javascript
js实现图片跟随鼠标移动效果
2019/10/16 Javascript
Sublime Text3 配置 NodeJs 环境的方法
2020/05/20 NodeJs
vue中defineProperty和Proxy的区别详解
2020/11/30 Vue.js
python与php实现分割文件代码
2017/03/06 Python
python2与python3的print及字符串格式化小结
2018/11/30 Python
python3.7 的新特性详解
2019/07/25 Python
关于pytorch中网络loss传播和参数更新的理解
2019/08/20 Python
python manage.py runserver流程解析
2019/11/08 Python
如何基于python实现归一化处理
2020/01/20 Python
pytorch实现seq2seq时对loss进行mask的方式
2020/02/18 Python
Django-rest-framework中过滤器的定制实例
2020/04/01 Python
css3中背景尺寸background-size详解
2014/09/02 HTML / CSS
美国糖果店:Sugarfina
2019/02/21 全球购物
Viking Direct荷兰:购买办公用品
2019/06/20 全球购物
阿里巴巴Oracle DBA笔试题答案-备份恢复类
2013/11/20 面试题
员工薪酬福利制度
2014/01/17 职场文书
春节超市活动方案
2014/08/14 职场文书
市场督导岗位职责
2015/04/10 职场文书
销售口号霸气押韵
2015/12/24 职场文书
Python文件的操作示例的详细讲解
2021/04/08 Python
react国际化react-intl的使用
2021/05/06 Javascript
如何使用Python提取Chrome浏览器保存的密码
2021/06/09 Python