Python实现的删除重复文件或图片功能示例【去重】


Posted in Python onApril 23, 2019

本文实例讲述了Python实现的删除重复文件或图片功能。分享给大家供大家参考,具体如下:

通过python爬虫或其他方式保存的图片文件通常包含一些重复的图片或文件,

通过下面的python代码可以将重复的文件删除以达到去重的目的。其中,文件目录结构如下图:

Python实现的删除重复文件或图片功能示例【去重】

# /usr/bin/env python
# -*- coding:utf-8 -*-
# 运行的代码文件要放到删除重复的文件或图片所包含的目录中
import os
import hashlib
def filecount():
  filecount = int(os.popen('dir /B |find /V /C ""').read())
  return (filecount)
def md5sum(filename):
  f = open(filename, 'rb')
  md5 = hashlib.md5()
  while True:
    fb = f.read(8096)
    if not fb:
      break
    md5.update(fb)
  f.close()
  return (md5.hexdigest())
def delfile():
  all_md5 = {}
  filedir = os.walk(os.getcwd())
  for i in filedir:
    for tlie in i[2]:
      if md5sum(tlie) in all_md5.values():
        os.remove(tlie)
      else:
        all_md5[tlie] = md5sum(tlie)
if __name__ == '__main__':
  oldf = filecount()
  print('去重前有', oldf, '个文件\n\n\n请稍等正在删除重复文件...')
  delfile()
  print('\n\n去重后剩', filecount(), '个文件')
  print('\n\n一共删除了', oldf - filecount(), '个文件\n\n')

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python使用Django实现博客系统完整版
Sep 29 Python
Django基础知识与基本应用入门教程
Jul 20 Python
利用Python查看微信共同好友功能的实现代码
Apr 24 Python
python selenium 查找隐藏元素 自动播放视频功能
Jul 24 Python
python绘图模块matplotlib示例详解
Jul 26 Python
PyCharm中代码字体大小调整方法
Jul 29 Python
Mac安装python3的方法步骤
Aug 09 Python
python 根据网易云歌曲的ID 直接下载歌曲的实例
Aug 24 Python
通过Python编写一个简单登录功能过程解析
Sep 04 Python
ansible-playbook实现自动部署KVM及安装python3的详细教程
May 11 Python
MAC平台基于Python Appium环境搭建过程图解
Aug 13 Python
python3跳出一个循环的实例操作
Aug 18 Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
详解python中的hashlib模块的使用
Apr 22 #Python
Python 中包/模块的 `import` 操作代码
Apr 22 #Python
You might like
wordpress自定义url参数实现路由功能的代码示例
2013/11/28 PHP
将PHP的session数据存储到数据库中的代码实例
2016/06/24 PHP
Javascript中的数学函数
2007/04/04 Javascript
jQuery源码分析之Event事件分析
2010/06/07 Javascript
JavaScript中清空数组的三种方法分享
2011/04/07 Javascript
8款非常棒的响应式jQuery 幻灯片插件推荐
2012/02/02 Javascript
同域jQuery(跨)iframe操作DOM(实例讲解)
2013/12/19 Javascript
两种JS实现屏蔽鼠标右键的方法
2020/08/20 Javascript
js实现四舍五入完全保留两位小数的方法
2016/08/02 Javascript
JavaScript实现清空(重置)文件类型INPUT元素值的方法
2016/11/17 Javascript
jQuery操作json常用方法示例
2017/01/04 Javascript
微信小程序 实战程序简易新闻的制作
2017/01/09 Javascript
基于vue.js路由参数的实例讲解——简单易懂
2017/09/07 Javascript
详解angularJS+Ionic移动端图片上传的解决办法
2017/09/13 Javascript
vuedraggable+element ui实现页面控件拖拽排序效果
2020/07/29 Javascript
IE11下CKEditor在Bootstrap Modal中下拉问题的解决
2019/09/25 Javascript
原生JS实现拖拽效果
2020/12/04 Javascript
[01:03:41]完美世界DOTA2联赛PWL S3 DLG vs Phoenix 第一场 12.17
2020/12/19 DOTA
Python open读写文件实现脚本
2008/09/06 Python
Python中apply函数的用法实例教程
2014/07/31 Python
Python查询阿里巴巴关键字排名的方法
2015/07/08 Python
python学习之面向对象【入门初级篇】
2017/01/21 Python
django在接受post请求时显示403forbidden实例解析
2018/01/25 Python
利用Python实现朋友圈中的九宫格图片效果
2020/09/03 Python
python爬虫如何解决图片验证码
2021/02/14 Python
配置H5的滚动条样式的示例代码
2018/03/09 HTML / CSS
美国杂志订阅折扣与优惠网站:Magazines.com
2016/08/31 全球购物
美国在线购买空气净化器、除湿器、加湿器网站:AllergyBuyersClub
2021/03/16 全球购物
本科毕业生专业自荐书范文
2014/02/05 职场文书
应急管理培训方案
2014/06/12 职场文书
岗位职责说明书模板
2014/07/30 职场文书
2014年教师节红领巾广播稿
2014/09/10 职场文书
教师党员自我剖析材料
2014/09/29 职场文书
离婚协议书怎样才有法律效力
2014/10/10 职场文书
幼儿园小班开学寄语
2015/05/27 职场文书
如何在Python中创建二叉树
2021/03/30 Python