用Python脚本来删除指定容量以上的文件的教程


Posted in Python onMay 04, 2015

文件多了乱放, 突然有一天发现硬盘空间不够了, 于是写了个python脚本搜索所有大于10MB的文件,看看这些大文件有没有重复的副本,如果有,全部列出,以便手工删除

使用方式 加一个指定目录的参数

比如python redundant_remover.py /tmp

主要用到了stat模块,os、sys系统模块

import os, sys
#引入统计模块
from stat import *
BIG_FILE_THRESHOLD = 10000000L
dict1 = {}  # filesize 做 key, filename 做 value
dict2 = {}   # filename 做 key, filesize 做 value
def treewalk(path):
  try:
    for i in os.listdir(path):
      mode = os.stat(path+"/"+i).st_mode
      if S_ISDIR(mode) <> True:
        filename = path+"/"+i
        filesize = os.stat(filename).st_size
        if filesize > BIG_FILE_THRESHOLD:
          if filesize in dict1:           
            dict2[filename] = filesize
            dict2[dict1[filesize]]=filesize
          else:
            dict1[filesize] = filename         
      else:
        treewalk(path+"/"+i)
  except WindowsError:
    pass
def printdict(finaldict):
  for i_size in finaldict.values():
    print i_size
    for j_name in finaldict.keys():
      if finaldict[j_name] == i_size:
        print j_name
    print "\n"
if __name__=="__main__":
  treewalk(sys.argv[1])
  printdict(dict2)
Python 相关文章推荐
在Python中使用异步Socket编程性能测试
Jun 25 Python
Python连接mysql数据库的正确姿势
Feb 03 Python
Python基于pillow判断图片完整性的方法
Sep 18 Python
Python3.5面向对象编程图文与实例详解
Apr 24 Python
python flask框架实现传数据到js的方法分析
Jun 11 Python
浅谈PyQt5 的帮助文档查找方法,可以查看每个类的方法
Jun 25 Python
选择Python写网络爬虫的优势和理由
Jul 07 Python
python pandas 时间日期的处理实现
Jul 30 Python
wxPython实现整点报时
Nov 18 Python
ansible动态Inventory主机清单配置遇到的坑
Jan 19 Python
基于python实现模拟数据结构模型
Jun 12 Python
python如何删除列为空的行
Jul 17 Python
编写Python脚本来获取Google搜索结果的示例
May 04 #Python
编写Python脚本来实现最简单的FTP下载的教程
May 04 #Python
Python下线程之间的共享和释放示例
May 04 #Python
简单介绍Python中利用生成器实现的并发编程
May 04 #Python
简单分析Python中用fork()函数生成的子进程
May 04 #Python
python实现从字典中删除元素的方法
May 04 #Python
Python中利用原始套接字进行网络编程的示例
May 04 #Python
You might like
PHP脚本数据库功能详解(上)
2006/10/09 PHP
php 无限级 SelectTree 类
2009/05/19 PHP
Ajax+PHP快速上手及简单应用说明
2013/07/24 PHP
php获取随机数组列表的方法
2014/11/13 PHP
基于php实现七牛抓取远程图片
2015/12/01 PHP
PHP实现适用于文件内容操作的分页类
2016/06/15 PHP
php 中奖概率算法实现代码
2017/01/25 PHP
phpfpm的作用和用法
2019/10/10 PHP
使用JavaScript检测Firefox浏览器是否启用了Firebug的代码
2010/12/28 Javascript
jquery批量控制form禁用的代码
2013/08/06 Javascript
javascript:void(0)是什么意思示例介绍
2013/11/17 Javascript
JavaScript父子窗体间的调用方法
2015/03/31 Javascript
AngularJS优雅的自定义指令
2016/07/01 Javascript
完美解决IE不支持Data.parse()的问题
2016/11/24 Javascript
AngularJS中update两次出现$promise属性无法识别的解决方法
2017/01/05 Javascript
对于Javascript 执行上下文的全面了解
2017/09/05 Javascript
Vue.js移动端左滑删除组件的实现代码
2017/09/08 Javascript
javascript+jQuery实现360开机时间显示效果
2017/11/03 jQuery
关于layui 下拉列表的change事件详解
2019/09/20 Javascript
[45:50]完美世界DOTA2联赛PWL S3 CPG vs Forest 第二场 12.16
2020/12/17 DOTA
python处理文本文件并生成指定格式的文件
2014/07/31 Python
用Python进行行为驱动开发的入门教程
2015/04/23 Python
Pandas之drop_duplicates:去除重复项方法
2018/04/18 Python
Python3.5文件读与写操作经典实例详解
2019/05/01 Python
使用python list 查找所有匹配元素的位置实例
2019/06/11 Python
Python实现桌面翻译工具【新手必学】
2020/02/12 Python
HTML5 form标签之解放表单验证、增加文件上传、集成拖放的使用方法
2013/04/24 HTML / CSS
澳大利亚人信任的清洁平台,您的私人管家:Jarvis
2020/12/25 全球购物
火锅店创业计划书范文
2014/02/02 职场文书
社区敬老月活动实施方案
2014/02/17 职场文书
护理专科自荐书范文
2014/02/18 职场文书
奥巴马当选演讲稿
2014/09/10 职场文书
股东出资证明书(正规版)
2014/09/24 职场文书
优秀党员推荐材料
2014/12/18 职场文书
导游词幽默开场白
2019/06/26 职场文书
两行代码解决Jupyter Notebook中文不能显示的问题
2021/04/24 Python