python zip文件 压缩


Posted in Python onDecember 24, 2008

从简单的角度来看的话,zip格式会是个不错的选择,而且python对zip格式的支持够简单,够好用。
1)简单应用
如果你仅仅是希望用python来做压缩和解压缩,那么就不用去翻文档了,这里提供一个简单的用法,让你一看就能明白。
import zipfile
f = zipfile.ZipFile('filename.zip', 'w' ,zipfile.ZIP_DEFLATED)
f.write('file1.txt')
f.write('file2.doc')
f.write('file3.rar')
f.close()
f.zipfile.ZipFile('filename')
f.extractall()
f.close()
不知道上面的例子是不是足够简单呢?
1.1 zipfile.ZipFile(fileName[, mode[, compression[, allowZip64]]])
fileName是没有什么疑问的了。
mode和一般的文件操作一样,'r'表示打开一个存在的只读ZIP文件;'w'表示清空并打开一个只写的ZIP文件,或创建一个只写的ZIP文件;'a'表示打开一个ZIP文件,并添加内容。
compression表示压缩格式,可选的压缩格式只有2个:ZIP_STORE;ZIP_DEFLATED。ZIP_STORE是默认的,表示不压缩;ZIP_DEFLATED表示压缩,如果你不知道什么是Deflated,那么建议你去补补课。
allowZip64为True时,表示支持64位的压缩,一般而言,在所压缩的文件大于2G时,会用到这个选项;默认情况下,该值为False,因为Unix系统不支持。
1.2 zipfile.close()
说真的,这个没什么可说的,如果有的话,那就是你写入的任何文件在关闭之前不会真正写入磁盘。
1.3 zipfile.write(filename[, arcname[, compress_type]])
acrname是压缩文件中该文件的名字,默认情况下和filename一样
compress_type的存在是因为zip文件允许被压缩的文件可以有不同的压缩类型。
1.4 zipfile.extractall([path[, member[, password]]])
path解压缩目录,没什么可说的
member需要解压缩的文件名儿列表
password当zip文件有密码时需要该选项
对于简单的应用,这么多就够了。
2)高级应用
2.1 zipfile.is_zipfile(filename)
判断一个文件是不是压缩文件
2.2 ZipFile.namelist()
返回文件列表
2.3 ZipFile.open(name[, mode[, password]])
打开压缩文档中的某个文件
2.4 ZipFile.infolist()
2.5 ZipFile.getinfo(name)
上述文件返回ZipInfo对象,只不过一个返回的是列表,一个返回的是一个ZipInfo
ZipInfo类
2.6 ZipInfo.filename
2.7 ZipInfo.date_time
返回值的格式为(year,month,date,hour,minute,second)
2.8 ZipInfo.compress_type
2.9 ZipInfo.comment
2.10ZipInfo.extra
2.11ZipInfo.create_system
2.12ZipInfo.extract_version
2.13ZipInfo.reserved 总是0
2.14ZipInfo.flag_bits
2.15ZipInfo.volume
2.16ZipInfo.internal_attr
2.17ZipInfo.external_attr
2.18ZipInfo.header_offset
2.19ZipInfo.CRC
2.20ZipInfo.file_size
2.21ZipInfo.compress_size
2.22ZipFile.testzip()
检查每个文件和它对应的CRC,如果有错误返回对应的文件列表
2.23ZipFile.setpassword(password)
2.24ZipFile.read(name[,password])
返回对应的文件
2.25ZipFile.printdir()
打印压缩文件夹的信息
2.26ZipFile.writestr(zipinfo_or_arcname, bytes)
PyZipFile类
zipfile.PyZipFile除了上面的方法和属性之外,还有一个特殊的方法
2.27PyZipFile.writepy(pathname,basename)
一般情况下,仅仅压缩.pyc和.pyo文件,不压缩.py文件
----------------------------------------------------------------------
zip文件格式信息
一个 ZIP 文件由三个部分组成:压缩源文件数据区+压缩源文件目录区+压缩源文件目录结束标志
1)压缩源文件数据区
在这个数据区中每一个压缩的源文件/目录都是一条记录,记录的格式如下: [文件头+ 文件数据 + 数据描述符]

a、文件头结构

组成 长度

文件头标记 4 bytes (0x04034b50)

解压文件所需 pkware 版本 2 bytes

全局方式位标记 2 bytes

压缩方式 2 bytes

最后修改文件时间 2 bytes

最后修改文件日期 2 bytes

CRC-32校验 4 bytes

压缩后尺寸 4 bytes

未压缩尺寸 4 bytes

文件名长度 2 bytes

扩展记录长度 2 bytes

文件名 (不定长度)

扩展字段 (不定长度)


b、文件数据


c、数据描述符

组成 长度

CRC-32校验 4 bytes

压缩后尺寸 4 bytes

未压缩尺寸 4 bytes

这个数据描述符只在全局方式位标记的第3位设为1时才存在(见后详解),紧接在压缩数据的最后一个字节后。这个数据描述符只用在不能对输出的 ZIP 文件进行检索时使用。例如:在一个不能检索的驱动器(如:磁带机上)上的 ZIP 文件中。如果是磁盘上的ZIP文件一般没有这个数据描述符。


2)压缩源文件目录区

在这个数据区中每一条纪录对应在压缩源文件数据区中的一条数据

组成 长度

目录中文件文件头标记 4 bytes (0x02014b50)

压缩使用的pkware 版本 2 bytes

解压文件所需 pkware 版本 2 bytes

全局方式位标记 2 bytes

压缩方式 2 bytes

最后修改文件时间 2 bytes

最后修改文件日期 2 bytes

CRC-32校验 4 bytes

压缩后尺寸 4 bytes

未压缩尺寸 4 bytes

文件名长度 2 bytes

扩展字段长度 2 bytes

文件注释长度 2 bytes

磁盘开始号 2 bytes

内部文件属性 2 bytes

外部文件属性 4 bytes

局部头部偏移量 4 bytes

文件名 (不定长度)

扩展字段 (不定长度)

文件注释 (不定长度)


3)压缩源文件目录结束标志

组成 长度

目录结束标记 4 bytes (0x02014b50)

当前磁盘编号 2 bytes

目录区开始磁盘编号 2 bytes

本磁盘上纪录总数 2 bytes

目录区中纪录总数 2 bytes

目录区尺寸大小 4 bytes

目录区对第一张磁盘的偏移量 4 bytes

ZIP 文件注释长度 2 bytes

ZIP 文件注释 (不定长度)

Python 相关文章推荐
LRUCache的实现原理及利用python实现的方法
Nov 21 Python
python+opencv+caffe+摄像头做目标检测的实例代码
Aug 03 Python
python利用插值法对折线进行平滑曲线处理
Dec 25 Python
Python3.5装饰器典型案例分析
Apr 30 Python
Python3.7 pyodbc完美配置访问access数据库
Oct 03 Python
浅谈python元素如何去重,去重后如何保持原来元素的顺序不变
Feb 28 Python
Python多线程通信queue队列用法实例分析
Mar 24 Python
基于python实现计算且附带进度条代码实例
Mar 31 Python
如何在Python对Excel进行读取
Jun 04 Python
python如何爬取网页中的文字
Jul 28 Python
Django实现微信小程序支付的示例代码
Sep 03 Python
去除python中的字符串空格的简单方法
Dec 22 Python
python 数据加密代码
Dec 24 #Python
python 测试实现方法
Dec 24 #Python
Python 面向对象 成员的访问约束
Dec 23 #Python
pymssql ntext字段调用问题解决方法
Dec 17 #Python
python 图片验证码代码
Dec 07 #Python
下载糗事百科的内容_python版
Dec 07 #Python
python 参数列表中的self 显式不等于冗余
Dec 01 #Python
You might like
PHP 简单日历实现代码
2009/10/28 PHP
深入理解curl类,可用于模拟get,post和curl下载
2013/06/08 PHP
php对称加密算法示例
2014/05/07 PHP
javascript 不间断的图片滚动并可点击
2010/01/15 Javascript
使用Json比用string返回数据更友好,也更面向对象一些
2011/09/13 Javascript
HTML上传控件取消选择
2013/03/06 Javascript
BootStrap中Table分页插件使用详解
2016/10/09 Javascript
jQuery 控制文本框自动缩小字体填充
2017/06/16 jQuery
基于jquery实现多选下拉列表
2017/08/02 jQuery
weex slider实现滑动底部导航功能
2017/08/28 Javascript
vue配置请求本地json数据的方法
2018/04/11 Javascript
vue实现div拖拽互换位置
2020/07/29 Javascript
详解TypeScript+Vue 插件 vue-class-component的使用总结
2019/02/18 Javascript
基于vue实现图片验证码倒计时60s功能
2019/12/10 Javascript
JS禁用右键、禁用Ctrl+u、禁用Ctrl+s、禁用F12的实现代码
2020/12/01 Javascript
[26:52]LGD vs EG 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/18 DOTA
Python脚本实现集群检测和管理功能
2015/03/06 Python
日常整理python执行系统命令的常见方法(全)
2015/10/22 Python
python爬虫之BeautifulSoup 使用select方法详解
2017/10/23 Python
Python使用pymongo模块操作MongoDB的方法示例
2018/07/20 Python
python如何查看微信消息撤回
2018/11/27 Python
在Pycharm中执行scrapy命令的方法
2019/01/16 Python
啥是佩奇?使用Python自动绘画小猪佩奇的代码实例
2019/02/20 Python
python求解汉诺塔游戏
2020/07/09 Python
Python编写单元测试代码实例
2020/09/10 Python
python多线程爬取西刺代理的示例代码
2021/01/30 Python
HTML5获取当前地理位置并在百度地图上展示的实例
2020/07/10 HTML / CSS
化工专业大学生职业生涯规划书
2014/01/14 职场文书
学习全国两会精神心得体会范文
2014/03/17 职场文书
商务日语专业自荐信
2014/04/17 职场文书
节能减耗标语
2014/06/21 职场文书
投标授权委托书范文
2014/08/02 职场文书
2014年十一国庆节活动方案
2014/09/16 职场文书
2014年校务公开工作总结
2014/12/18 职场文书
导游词之岳阳楼
2019/09/25 职场文书
SQL试题 使用窗口函数选出连续3天登录的用户
2022/04/24 Oracle