python+POP3实现批量下载邮件附件


Posted in Python onJune 19, 2018

最近新开学,接到了给老板的本科课程当助教的工作,百十来号人一学期下来得有四五次作业发进邮箱里,需要我来统计打分,想想挨个点进去下载附件的过程就头大,于是萌生了写个脚本来统计作业的想法。

其实python里收发邮件都有很方便的包,合理使用就好,可以解决绝大多数的邮件收发任务。但是这个脚本写下来还是花了不少时间,其中最大的一部分时间是花在了python的编码问题上,python2和python3的编码预设有些许的不一样,在python3中又取消了unicode这个方法,这就导致很多在python2中写的例程都没法在3中运行。

经过修改以后下面的脚本可以从邮箱中获取指定日期范围内的邮件附件,并存如指定目录中。

#!/usr/bin/env python3 
# -*- coding: utf-8 -*- 
import poplib 
import email 
import datetime 
import time 
import os 
import xlrd 
import xlwt 
from email.parser import Parser 
from email.header import decode_header 
from email.utils import parseaddr 
 
 
 
# 输入邮件地址, 口令和POP3服务器地址: 
email = 'xxxxxxxx@qq.com' 
password = 'xxxxxxxxxxx' 
pop3_server = 'pop.qq.com' 
 
 
 
def decode_str(s):#字符编码转换 
  value, charset = decode_header(s)[0] 
  if charset: 
    value = value.decode(charset) 
  return value 
 
 
def get_att(msg): 
  import email 
  attachment_files = [] 
   
  for part in msg.walk(): 
    file_name = part.get_filename()#获取附件名称类型 
    contType = part.get_content_type() 
     
    if file_name:  
      h = email.header.Header(file_name) 
      dh = email.header.decode_header(h)#对附件名称进行解码 
      filename = dh[0][0] 
      if dh[0][1]: 
        filename = decode_str(str(filename,dh[0][1]))#将附件名称可读化 
        print(filename) 
        #filename = filename.encode("utf-8") 
      data = part.get_payload(decode=True)#下载附件 
      att_file = open('E:\\L\\zy\\307\\' + filename, 'wb')#在指定目录下创建文件,注意二进制文件需要用wb模式打开 
      attachment_files.append(filename) 
      att_file.write(data)#保存附件 
      att_file.close() 
  return attachment_files 
 
     
       
# 连接到POP3服务器,有些邮箱服务器需要ssl加密,对于不需要加密的服务器可以使用poplib.POP3() 
server = poplib.POP3_SSL(pop3_server) 
server.set_debuglevel(1) 
# 打印POP3服务器的欢迎文字: 
print(server.getwelcome().decode('utf-8')) 
# 身份认证: 
server.user(email) 
server.pass_(password) 
# 返回邮件数量和占用空间: 
print('Messages: %s. Size: %s' % server.stat()) 
# list()返回所有邮件的编号: 
resp, mails, octets = server.list() 
# 可以查看返回的列表类似[b'1 82923', b'2 2184', ...] 
print(mails) 
index = len(mails) 
 
 
 
for i in range(index,0,-1): 
  #倒序遍历邮件 
  resp, lines, octets = server.retr(i) 
  # lines存储了邮件的原始文本的每一行, 
  #邮件的原始文本: 
  msg_content = b'\r\n'.join(lines).decode('utf-8') 
  #解析邮件: 
  msg = Parser().parsestr(msg_content) 
  #获取邮件时间 
  date1 = time.strptime(msg.get("Date")[0:24],'%a, %d %b %Y %H:%M:%S') #格式化收件时间 
  date2 = time.strftime("%Y%m%d", date1)#邮件时间格式转换 
  if (date2<'20180306')|(date2>'20180314'): 
     
    continue 
  f_list = get_att(msg)#获取附件 
   
     
   
  #print_info(msg) 
 
server.quit()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python NumPy库安装使用笔记
May 18 Python
Python快速排序算法实例分析
Nov 29 Python
win10 64bit下python NLTK安装教程
Sep 19 Python
对dataframe数据之间求补集的实例详解
Jan 30 Python
Python3.5内置模块之time与datetime模块用法实例分析
Apr 27 Python
python中selenium操作下拉滚动条的几种方法汇总
Jul 14 Python
Matplotlib中%matplotlib inline如何使用
Jul 28 Python
举例讲解Python装饰器
Dec 24 Python
用python监控服务器的cpu,磁盘空间,内存,超过邮件报警
Jan 29 Python
用python实现监控视频人数统计
May 21 Python
Python编程中内置的NotImplemented类型的用法
Mar 23 Python
python实现双向链表原理
May 25 Python
python实现批量解析邮件并下载附件
Jun 19 #Python
Python3使用SMTP发送带附件邮件
Jun 16 #Python
Python3使用turtle绘制超立方体图形示例
Jun 19 #Python
python3使用SMTP发送HTML格式邮件
Jun 19 #Python
python3.X 抓取火车票信息【修正版】
Jun 19 #Python
python3使用SMTP发送简单文本邮件
Jun 19 #Python
Python基于pyCUDA实现GPU加速并行计算功能入门教程
Jun 19 #Python
You might like
提升PHP执行速度全攻略
2006/10/09 PHP
PHP 文件上传全攻略
2010/04/28 PHP
比较全面的PHP数组的使用方法小结
2010/09/23 PHP
PHP程序员常见的40个陋习,你中了几个?
2014/11/20 PHP
windows server 2008/2012安装php iis7 mysql环境搭建教程
2016/06/30 PHP
PHP中的自动加载操作实现方法详解
2019/08/06 PHP
php5与php7的区别点总结
2019/10/11 PHP
jQuery 阴影插件代码分享
2012/01/09 Javascript
JavaScript获取网页、浏览器、屏幕高度和宽度汇总
2014/12/18 Javascript
javascript中动态函数用法实例分析
2015/05/14 Javascript
JavaScript用select实现日期控件
2015/07/17 Javascript
JavaScript实现点击单选按钮改变输入框中文本域内容的方法
2015/08/12 Javascript
jQuery Easyui 验证两次密码输入是否相等
2016/05/13 Javascript
什么是JavaScript中的结果值?
2016/10/08 Javascript
Angular.Js之Scope作用域的学习教程
2017/04/27 Javascript
nodejs密码加密中生成随机数的实例代码
2017/07/17 NodeJs
详解wow.js中各种特效对应的类名
2017/09/13 Javascript
vue获取DOM元素并设置属性的两种实现方法
2017/09/30 Javascript
nodejs使用express获取get和post传值及session验证的方法
2017/11/09 NodeJs
Angular5集成eventbus的示例代码
2018/07/19 Javascript
js+canvas实现转盘效果(两个版本)
2020/09/13 Javascript
[35:26]DOTA2上海特级锦标赛B组小组赛#2 VG VS Fnatic第三局
2016/02/26 DOTA
浅谈Python中列表生成式和生成器的区别
2015/08/03 Python
更新升级python和pip版本后不生效的问题解决
2020/04/17 Python
Python填充任意颜色,不同算法时间差异分析说明
2020/05/16 Python
python全栈开发语法总结
2020/11/22 Python
公司会计主管岗位责任制
2014/03/01 职场文书
妇女儿童发展规划实施方案
2014/03/16 职场文书
网站美工岗位职责
2014/04/02 职场文书
后进生评语大全
2015/01/04 职场文书
2015年公司工作总结
2015/04/25 职场文书
死亡诗社观后感
2015/06/05 职场文书
陪护人员误工证明
2015/06/24 职场文书
小学语文的各类谚语(70首)
2019/08/15 职场文书
Vue组件更新数据v-model不生效的解决
2022/04/02 Vue.js
Python查找算法的实现 (线性、二分,分块、插值查找算法)
2022/04/24 Python