Python在后台自动解压各种压缩文件的实现方法


Posted in Python onNovember 10, 2020

1.需求描述

编写一个 Python 程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点:

  • os 模块综合应用
  • glob 模块综合应用
  • 利用 gzip zipfile rarfile tarfile 模块解压文件

2.步骤分析和前置知识

码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为:

  1. 定时检测某个文件夹(如 download 文件夹)是否存在压缩文件
  2. 如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中 删除压缩文件
  3. 提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

.gz: 即 gzip,通常只能压缩一个文件
.tar: 本质上不是压缩工具而是打包工具,可以跟 .gz 配合形成 .tar.gz 的打包压缩格式 .zip: 和 .tar.gz 很类似但可以打包压缩多个文件
.rar: 打包压缩文件,最初用于 DOS

因此,文件是否为压缩文件的判断逻辑可以如下:

  1. 建立一个含压缩包后缀的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
  2. 目标文件夹下的所有文件名运行 filename.split(.)[-1] 获取后缀名
  3. 判断后缀名是否在 compressed_lst 中,如果存在则运行后续的解压代码
  4. 如果是以 gz 结尾的文件,解压后需要再次判断是否是以 .tar 结尾,并进行相应处理

不同压缩文件的解压代码各不相同,在后续代码操作中具体展开。

3.代码实现

首先是获取 download 文件夹下所有文件的文件名

import glob
import os

path = r'C:\xxxx\download'
file_lst = glob.glob(path + '/*')
# 列表推导式
filename_lst = [os.path.basename(i) for i in file_lst]

print(filename_lst)

接下来根据文件的后缀名判断是否需要压缩,先看一下代码框架

for i in filename_lst:
 if '.' in i:
  # 获取后缀名
  suffix = i.split('.')[-1]
  # 逐个将后缀名和各格式的压缩后缀匹配
  if suffix == 'gz':
   pass
   if ...: # 再次判断新产生的文件名是否以 .tar 结尾
    pass
  if suffix == 'tar':
   pass
  if suffix == 'zip':
   pass
  if suffix == 'rar':
   pass

这里有2个注意点:

有些文件没有后缀名,因此可能不存在 .,这时用 filename.split('.')[-1]会报错,因此需要先判断
以.gz 结尾的文件,解压后需要再次判断是否是以 .tar 结尾,然后我们就可以分别将四种压缩文件的解压代码写成函数,符合时候单独调用即可
1、处理.gz 文件

import gzip

def ungz(filename):
 filename = filename[:-3] # gz文件的单文件解压就是去掉 filename 后面的 .gz
 gz_file = gzip.GzipFile(filename)
 with open(filename, "w+") as file:
  file.write(gz_file.read())
  return filename # 这个gzip的函数需要返回值以进一步配合untar函数

前面反复提及的 gz 文件有可能跟 tar 文件配合,因此解压 gz 文件后需要再判断是否有必要解开 tar 文件
这里就可以先把 tar 文件的函数写出来
2、处理.tar文件

import tarfile

def untar(filename):
 tar = tarfile.open(filename)
 names = tar.getnames()
 # tar本身是将文件打包,解除打包会产生很多文件,因此需要建立文件夹存放
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for name in names:
  tar.extract(name, filename + "_dir/")
 tar.close()

3、处理.zip文件

import zipfile

def unzip(filename):
 zip_file = zipfile.ZipFile(filename)
 # 类似tar解除打包,建立文件夹存放解压的多个文件
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for names in zip_file.namelist():
  zip_file.extract(names, filename + "_dir/")
 zip_file.close()

4、处理.rar文件

import rarfile

def unrar(filename):
 rar = rarfile.RarFile(filename)
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 os.chdir(filename + "_dir")
 rar.extractall()
 rar.close()

可以看到,四种解压代码略有不同,推荐大家实际演示中自己体会一下差别,解压后配合 os.remove() 就可以删除压缩包,现在看看逻辑框架补上解压函数后的内容:

for filename in filename_lst:
 if '.' in filename:
  suffix = filename.split('.')[-1]
  if suffix == 'gz':
   new_filename = ungz(filename)
   os.remove(filename)
   if new_filename.split('.')[-1] == 'tar':
    untar(new_filename)
    os.remove(new_filename) 
  if suffix == 'tar':
   untar(filename)
   os.remove(filename)
  if suffix == 'zip':
   unzip(filename)
   os.remove(filename)
  if suffix == 'rar':
   unrar(filename)
   os.remove(filename)

5、实现实时检测

比较简单的方法就是建立 while True 死循环配合 time.sleep()睡眠,框架如下:

import time

while True:
 func()
 time.sleep(5) # 睡眠秒数可以设置大一点避免过度占用资源

最后将第二步的实现代码改为函数并放在循环框架中就可以完成本次需求,完整代码如下

import glob
import os
import gzip
import tarfile
import zipfile
import rarfile
import time

path = r'C:\xxxx\download'
file_lst = glob.glob(path + '/*')
filename_lst = [os.path.basename(i) for i in file_lst]

def ungz(filename):
 filename = filename[:-3]
 gz_file = gzip.GzipFile(filename)
 with open(filename, "w+") as file:
  file.write(gz_file.read())
 return filename

def untar(filename):
 tar = tarfile.open(filename)
 names = tar.getnames()
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for name in names:
  tar.extract(name, filename + "_dir/")
 tar.close()

def unzip(filename):
 zip_file = zipfile.ZipFile(filename)
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for names in zip_file.namelist():
  zip_file.extract(names, filename + "_dir/")
 zip_file.close()

def unrar(filename):
 rar = rarfile.RarFile(filename)
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 os.chdir(filename + "_dir")
 rar.extractall()
 rar.close()

def unzip_files():
 for filename in filename_lst:
  if '.' in filename:
   suffix = filename.split('.')[-1]
   if suffix == 'gz':
    new_filename = ungz(filename)
    os.remove(filename)
    if new_filename.split('.')[-1] == 'tar':
     untar(new_filename)
     os.remove(new_filename)
   if suffix == 'tar':
    untar(filename)
    os.remove(filename)
   if suffix == 'zip':
    unzip(filename)
    os.remove(filename)
   if suffix == 'rar':
    unrar(filename)
    os.remove(filename)

while True:
 unzip_files()
 time.sleep(5)

到此这篇关于Python在后台自动解压各种压缩文件的实现方法的文章就介绍到这了,更多相关Python自动解压各种压缩文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
在python的WEB框架Flask中使用多个配置文件的解决方法
Apr 18 Python
python中实现php的var_dump函数功能
Jan 21 Python
python对url格式解析的方法
May 13 Python
Django实战之用户认证(初始配置)
Jul 16 Python
Python字符串、整数、和浮点型数相互转换实例
Aug 04 Python
python组合无重复三位数的实例
Nov 13 Python
对Python+opencv将图片生成视频的实例详解
Jan 08 Python
Python多线程同步---文件读写控制方法
Feb 12 Python
详解Python3中ceil()函数用法
Feb 19 Python
python实现栅栏加解密 支持密钥加密
Mar 20 Python
Python实现检测文件的MD5值来查找重复文件案例
Mar 12 Python
使用Python开发贪吃蛇游戏 SnakeGame
Apr 30 Python
Python高阶函数与装饰器函数的深入讲解
Nov 10 #Python
pytorch学习教程之自定义数据集
Nov 10 #Python
pytorch加载语音类自定义数据集的方法教程
Nov 10 #Python
sublime3之内网安装python插件Anaconda的流程
Nov 10 #Python
python+excel接口自动化获取token并作为请求参数进行传参操作
Nov 10 #Python
python request 模块详细介绍
Nov 10 #Python
解决使用Pandas 读取超过65536行的Excel文件问题
Nov 10 #Python
You might like
在php MYSQL中插入当前时间
2008/04/06 PHP
php中socket通信机制实例详解
2015/01/03 PHP
JS(jQuery)实现聊天接收到消息语言自动提醒功能详解【提示“您有新的消息请注意查收”】
2019/04/16 PHP
Laravel 错误提示本地化的实现
2019/10/22 PHP
juqery 学习之三 选择器 子元素与表单
2010/11/25 Javascript
JavaScript基础知识之数据类型
2012/08/06 Javascript
js实现网站首页图片滚动显示
2013/02/04 Javascript
JQuery实现超链接鼠标提示效果的方法
2015/06/10 Javascript
Javascript函数式编程简单介绍
2015/10/11 Javascript
Bootstrap入门书籍之(五)导航条、分页导航
2016/02/17 Javascript
JavaScript将base64图片转换成formData并通过AJAX提交的实现方法
2016/10/24 Javascript
nodejs实例解析(输出hello world)
2017/01/03 NodeJs
vue-resource 拦截器使用详解
2017/02/21 Javascript
JS库之wow.js使用方法
2017/09/14 Javascript
浅析从vue源码看观察者模式
2018/01/29 Javascript
深入理解nodejs搭建静态服务器(实现命令行)
2019/02/05 NodeJs
微信小程序实现按字母排列选择城市功能
2019/11/25 Javascript
浅谈vue.watch的触发条件是什么
2020/11/07 Javascript
vue表单验证之禁止input输入框输入空格
2020/12/03 Vue.js
[02:54]DOTA2英雄基础教程 撼地者
2014/01/14 DOTA
python merge、concat合并数据集的实例讲解
2018/04/12 Python
python实现指定字符串补全空格、前面填充0的方法
2018/11/16 Python
使用Python画股票的K线图的方法步骤
2019/06/28 Python
详解python websocket获取实时数据的几种常见链接方式
2019/07/01 Python
利用anaconda作为python的依赖库管理方法
2019/08/13 Python
Python正则表达式如何匹配中文
2020/05/27 Python
浅谈python 调用open()打开文件时路径出错的原因
2020/06/05 Python
python绘图pyecharts+pandas的使用详解
2020/12/13 Python
美国高档百货Nordstrom的折扣店:Nordstrom Rack
2017/11/13 全球购物
27个经典Linux面试题及答案,你知道几个?
2014/03/11 面试题
员工团队活动方案
2014/08/28 职场文书
一份关于丢失公司财物的检讨书
2014/09/19 职场文书
员工表扬信怎么写
2015/05/05 职场文书
个人催款函范文
2015/06/24 职场文书
MySQL 外键约束和表关系相关总结
2021/06/20 MySQL
MySQL的表级锁,行级锁,排它锁和共享锁
2022/07/15 MySQL