用Python删除本地目录下某一时间点之前创建的所有文件的实例


Posted in Python onDecember 14, 2017

因为工作原因,需要定期清理某个文件夹下面创建时间超过1年的所有文件,所以今天集中学习了一下Python对于本地文件及文件夹的操作。网上 这篇文章 简明扼要地整理出最常见的os方法,抄袭如下:

os.listdir(dirname):列出dirname下的目录和文件
os.getcwd():获得当前工作目录
os.curdir:返回当前目录('.')
os.chdir(dirname):改变工作目录到dirname
os.path.isdir(name):判断name是不是一个目录,name不是目录就返回false
os.path.isfile(name):判断name是不是一个文件,不存在name也返回false
os.path.exists(name):判断是否存在文件或目录name
os.path.getsize(name):获得文件大小,如果name是目录返回0L
os.path.abspath(name):获得绝对路径
os.path.normpath(path):规范path字符串形式
os.path.split(name):分割文件名与目录(事实上,如果你完全使用目录,它也会将最后一个目录作为文件名而分离,同时它不会判断文件或目录是否存在)
os.path.splitext():分离文件名与扩展名
os.path.join(path,name):连接目录与文件名或目录
os.path.basename(path):返回文件名
os.path.dirname(path):返回文件路径
os.remove(dir) #dir为要删除的文件夹或者文件路径
os.rmdir(path) #path要删除的目录的路径。需要说明的是,使用os.rmdir删除的目录必须为空目录,否则函数出错。
os.path.getmtime(name) #获取文件的修改时间
os.stat(path).st_mtime#获取文件的修改时间
os.stat(path).st_ctime #获取文件修改时间
os.path.getctime(name)#获取文件的创建时间

于是我照着这些方法,费半天劲,终于写出了“清理某路径下所有文件及文件夹”的方法,代码如下:

import os
dirToBeEmptied = 'D:\_Data\Python\os' #需要清空的文件夹
ds = list(os.walk(dirToBeEmptied)) #获得所有文件夹的信息列表
dsr = ds[::-1] #反转该列表,从最底层的文件夹开始清算
for d in dsr: #遍历该列表
 print(d) #打印出列表项,观察规律
 if d[2] != []: #如果该路径下有文件
  for x in d[2]: #先将文件清理干净
   os.remove(os.path.join(d[0], x))
for d in dsr: #再次遍历该列表
 if d[1] != []: #如果该路径下有子文件夹
  for y in d[1]: #将子文件夹清理干净
   os.rmdir(os.path.join(d[0], y))

之所以这么麻烦,是因为 os.rmdir() 有个毛病,只能删除“空”文件夹。所以只能从最底层的文件夹开始清理,一级一级往上,才能清干净。

后来想想,应该有更简便的方法,因为清空文件夹是很常见的动作。查了Python官方文档,发现了os以外的另一个模块:shutil(高级文件操作),竟然有 shutil.rmtree() 的方法,不仅是清空,直接连文件夹都一起删掉,太凶残了!

为了“仅仅清空”,我搭配使用 shutil 模块重写了代码:

import shutil, os
os.chdir('d:\_data\python\os') #进入要清空的目录
ds = list(os.listdir()) #获得该目录下所有文件或文件夹列表
for d in ds: #遍历该列表
 if os.path.isfile(d): #如果列表项是文件
  os.remove(d) #直接删除
 else: #如果不是文件,肯定是文件夹
  shutil.rmtree(d) #也直接删除

这下可就简洁多了。

不过,清空一时爽,但已经偏离我原来的目的了:我只是想删除过期的文件,但文件夹和所有子文件夹都得留着啊。倒也不难,最开始的代码中,第1次遍历列表就是只删文件、不删文件夹。只要再加个判断语句,判断出文件是否过期,就能达到目的了。

我要删除的文件,实际上是做镜像备份时,将已从主机删除或更改的文件暂时保存下来,以备恢复之用。这些文件久了会越来越占空间,因此设定为1年过期。这些文件有一个特点,就是只会被复制过来一次,且不会有任何修改,因此只需要判断其创建日期就可以。

想着是容易,但万万没想到,Python对时间的处理这么复杂!涉及到两个模块:datetime 和 time。有时间必须重头系统学习一下,但这里,我只关心现在需要的几个方法:

datetime.datetime.now() #获取当前时间,返回值的格式类似 datetime.datetime(2017, 12, 14, 1, 29, 24, 406538)

datetime.timedelta() #设定两个时间之间的间隔,用于时间计算,可以设置的单位包括:(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0),默认都为0

os.path.getctime() #获取文件的创建时间,返回值的格式为一个巨大的浮点数,为1970年1月1日到这个创建时间所历经的秒数

datetime.datetime.fromtimestamp() #将os.path.getctime() 转换为跟datetime.datetime.now()一样的格式,以进行比较计算

弄清楚上面这些乱七八糟的之后,就可以写代码了:

import os, datetime
dirToBeEmptied = 'D:\_Data\Python\os' #需要清空的文件夹
ds = list(os.walk(dirToBeEmptied)) #获得所有文件夹的信息列表
delta = datetime.timedelta(days=365) #设定365天前的文件为过期
now = datetime.datetime.now() #获取当前时间
for d in ds: #遍历该列表
 os.chdir(d[0]) #进入本级路径,防止找不到文件而报错
 if d[2] != []: #如果该路径下有文件
  for x in d[2]: #遍历这些文件
   ctime = datetime.datetime.fromtimestamp(os.path.getctime(x)) #获取文件创建时间
   if ctime < (now-delta): #若创建于delta天前
    os.remove(x) #则删掉

呼~~~~~~~~~

真够复杂的!不知道有没有简便一点的办法……

以上这篇用Python删除本地目录下某一时间点之前创建的所有文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
将图片文件嵌入到wxpython代码中的实现方法
Aug 11 Python
python编写暴力破解FTP密码小工具
Nov 19 Python
Python实现Tab自动补全和历史命令管理的方法
Mar 12 Python
Python实现使用卷积提取图片轮廓功能示例
May 12 Python
使用Python制作表情包实现换脸功能
Jul 19 Python
python3 求约数的实例
Dec 05 Python
pytorch 图像中的数据预处理和批标准化实例
Jan 15 Python
解决Tensorboard可视化错误:不显示数据 No scalar data was found
Feb 15 Python
基于python实现破解滑动验证码过程解析
May 28 Python
一篇文章教你用python画动态爱心表白
Nov 22 Python
Python 如何实现文件自动去重
Jun 02 Python
python多次执行绘制条形图
Apr 20 Python
python编程通过蒙特卡洛法计算定积分详解
Dec 13 #Python
Python编程产生非均匀随机数的几种方法代码分享
Dec 13 #Python
windows下Virtualenvwrapper安装教程
Dec 13 #Python
python实现机械分词之逆向最大匹配算法代码示例
Dec 13 #Python
Python语言描述KNN算法与Kd树
Dec 13 #Python
Python xlwt设置excel单元格字体及格式
Apr 18 #Python
Python语言实现百度语音识别API的使用实例
Dec 13 #Python
You might like
推荐一篇入门级的Class文章
2007/03/19 PHP
无刷新动态加载数据 滚动条加载适合评论等页面
2013/10/16 PHP
php获取数组长度的方法(有实例)
2013/10/27 PHP
php实例分享之mysql数据备份
2014/05/19 PHP
php性能分析之php-fpm慢执行日志slow log用法浅析
2016/10/17 PHP
PHP中大括号'{}'用法实例总结
2017/02/08 PHP
Zend Framework基于Command命令行建立ZF项目的方法
2017/02/18 PHP
php安全配置记录和常见错误梳理(总结)
2017/03/28 PHP
thinkPHP5框架auth权限控制类与用法示例
2018/06/12 PHP
文本加密解密
2006/06/23 Javascript
jquery ajax跨域解决方法(json方式)
2014/02/04 Javascript
AngularJS iframe跨域打开内容时报错误的解决办法
2015/01/26 Javascript
jQuery源码解读之removeClass()方法分析
2015/02/20 Javascript
jquery.map()方法的使用详解
2015/07/09 Javascript
异步安全加载javascript文件的方法
2015/07/21 Javascript
理解javascript中DOM事件
2015/12/25 Javascript
jQuery Timelinr实现垂直水平时间轴插件(附源码下载)
2016/02/16 Javascript
一道关于JavaScript变量作用域的面试题
2016/03/08 Javascript
vue.js国际化 vue-i18n插件的使用详解
2017/07/07 Javascript
详解微信小程序中的页面代码中的模板的封装
2017/10/12 Javascript
实例解析ES6 Proxy使用场景介绍
2018/01/08 Javascript
微信小程序三级联动选择器使用方法
2020/05/19 Javascript
详解性能更优越的小程序图片懒加载方式
2018/07/18 Javascript
解决vue this.$forceUpdate() 处理页面刷新问题(v-for循环值刷新等)
2018/07/26 Javascript
对angularJs中2种自定义服务的实例讲解
2018/09/30 Javascript
在Vue项目中用fullcalendar制作日程表的示例代码
2019/08/04 Javascript
[46:20]DOTA2-DPC中国联赛 正赛 PSG.LGD vs LBZS BO3 第二场 1月22日
2021/03/11 DOTA
python 的列表遍历删除实现代码
2020/04/12 Python
Python按钮的响应事件详解
2019/03/04 Python
OpenCV 表盘指针自动读数的示例代码
2020/04/10 Python
HTML5手机端弹出遮罩菜单特效代码
2016/01/27 HTML / CSS
卡西欧B级产品官方网站:Casio Outlet
2018/05/22 全球购物
抽象方法、抽象类怎样声明
2014/10/25 面试题
员工培训邀请函
2014/01/11 职场文书
iPhone13 Pro外观确定,升级4800万镜头,4月20日发新品
2021/04/15 数码科技
redis数据一致性的实现示例
2022/03/18 Redis