编程 Python

在Python中使用zlib模块进行数据压缩的教程

Posted in Python onJune 26, 2015

Python标准模块中，有多个模块用于数据的压缩与解压缩，如zipfile，gzip, bz2等等。上次介绍了zipfile模块，今天就来讲讲zlib模块。
zlib.compress(string[, level])
zlib.decompress(string[, wbits[, bufsize]])

zlib.compress用于压缩流数据。参数string指定了要压缩的数据流，参数level指定了压缩的级别，它的取值范围是1到9。压缩速度与压缩率成反比，1表示压缩速度最快，而压缩率最低，而9则表示压缩速度最慢但压缩率最高。zlib.decompress用于解压数据。参数string指定了需要解压的数据，wbits和bufsize分别用于设置系统缓冲区大小(window buffer )与输出缓冲区大小(output buffer)。下面用一个例子来演示如何使用这两个方法：

#coding=gbk
 
import zlib, urllib
 
fp = urllib.urlopen('http://localhost/default.html')
str = fp.read()
fp.close()
 
#---- 压缩数据流。
str1 = zlib.compress(str, zlib.Z_BEST_COMPRESSION)
str2 = zlib.decompress(str1)
print len(str)
print len(str1)
print len(str2)
 
# ---- 结果
#5783
#1531
#5783

我们也可以使用Compress/Decompress对象来对数据进行压缩/解压缩。zlib.compressobj([level]) 与zlib.decompress(string[, wbits[, bufsize]]) 分别创建Compress/Decompress缩对象。通过对象对数据进行压缩和解压缩的使用方式与上面介绍的zlib.compress,zlib.decompress非常类似。但两者对数据的压缩还是有区别的，这主要体现在对大量数据进行操作的情况下。假如现在要压缩一个非常大的数据文件（上百M），如果使用zlib.compress来压缩的话，必须先一次性将文件里的数据读到内存里，然后将数据进行压缩。这样势必会战用太多的内存。如果使用对象来进行压缩，那么没有必要一次性读取文件的所有数据，可以先读一部分数据到内存里进行压缩，压缩完后写入文件，然后再读其他部分的数据压缩，如此循环重复，只到压缩完整个文件。下面一个例子来演示这之间的区别：

#coding=gbk
 
import zlib, urllib
 
fp = urllib.urlopen('http://localhost/default.html')  
# 访问的到的网址。
data = fp.read()
fp.close()
 
#---- 压缩数据流
str1 = zlib.compress(data, zlib.Z_BEST_COMPRESSION)
str2 = zlib.decompress(str1)
print '原始数据长度：', len(data)
print '-' * 30
print 'zlib.compress压缩后：', len(str1)
print 'zlib.decompress解压后：', len(str2)
print '-' * 30
 
#---- 使用Compress, Decompress对象对数据流进行压缩/解压缩
com_obj = zlib.compressobj(zlib.Z_BEST_COMPRESSION)
decom_obj = zlib.decompressobj()
 
str_obj = com_obj.compress(data)
str_obj += com_obj.flush()
print 'Compress.compress压缩后：', len(str_obj)
 
str_obj1 = decom_obj.decompress(str_obj)
str_obj1 += decom_obj.flush()
print 'Decompress.decompress解压后：', len(str_obj1)
print '-' * 30
 
#---- 使用Compress, Decompress对象，对数据进行分块压缩/解压缩。
com_obj1 = zlib.compressobj(zlib.Z_BEST_COMPRESSION)
decom_obj1 = zlib.decompressobj()
chunk_size = 30;
 
#原始数据分块
str_chunks = [data[i * chunk_size:(i + 1) * chunk_size] /
  for i in range((len(data) + chunk_size) / chunk_size)]
 
str_obj2 = ''
for chunk in str_chunks:
  str_obj2 += com_obj1.compress(chunk)
str_obj2 += com_obj1.flush()
print '分块压缩后：', len(str_obj2)
 
#压缩数据分块解压
str_chunks = [str_obj2[i * chunk_size:(i + 1) * chunk_size] /
  for i in range((len(str_obj2) + chunk_size) / chunk_size)]
str_obj2 = ''
for chunk in str_chunks:
  str_obj2 += decom_obj1.decompress(chunk)
str_obj2 += decom_obj1.flush()
print '分块解压后：', len(str_obj2)
 
# ---- 结果 ------------------------
原始数据长度： 5783
------------------------------
zlib.compress压缩后： 1531
zlib.decompress解压后： 5783
------------------------------
Compress.compress压缩后： 1531
Decompress.decompress解压后： 5783
------------------------------
分块压缩后： 1531
分块解压后： 5783

Python手册对zlib模块的介绍比较详细，更具体的应用，可以参考Python手册。

在Python中使用zlib模块进行数据压缩的教程

- Author -

DarkBull

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python中Genarator函数用法分析

Apr 08 Python

使用httplib模块来制作Python下HTTP客户端的方法

Jun 19 Python

python中偏函数partial用法实例分析

Jul 08 Python

Python编程之Re模块下的函数介绍

Oct 28 Python

Python中常见的异常总结

Feb 20 Python

python爬虫之模拟登陆csdn的实例代码

May 18 Python

学生信息管理系统Python面向对象版

Jan 30 Python

python创建属于自己的单词词库便于背单词

Jul 30 Python

python列表推导式操作解析

Nov 26 Python

python 实现批量替换文本中的某部分内容

Dec 13 Python

使用Python实现Wake On Lan远程开机功能

Jan 22 Python

python导入库的具体方法

Jun 18 Python

Python中的zipfile模块使用详解

Jun 25 #Python

Python实现保证只能运行一个脚本实例

Jun 24 #Python

Python中的默认参数详解

Jun 24 #Python

Python中的下划线详解

Jun 24 #Python

Python装饰器使用实例：验证参数合法性

Jun 24 #Python

Python线程详解

Jun 24 #Python

Python函数式编程指南（四）：生成器详解

Jun 24 #Python

You might like

PHP和Mysql中转UTF8编码问题汇总

2015/10/10 PHP

mysql alter table命令修改表结构实例详解

2016/09/24 PHP

php实现将base64格式图片保存在指定目录的方法

2016/10/13 PHP

Laravel框架查询构造器 CURD操作示例

2019/09/04 PHP

ext form 表单提交数据的方法小结

2008/08/08 Javascript

查询绑定数据岛的表格中的文本并修改显示方式的js代码

2009/12/15 Javascript

jquery中实现简单的tabs插件功能的代码

2011/03/02 Javascript

基于jquery实现漂亮的动态信息提示效果

2011/08/02 Javascript

javascript陷阱一不小心你就中招了(字符运算)

2013/11/10 Javascript

EasyUI布局高度自适应

2016/06/04 Javascript

js仿支付宝多方框输入支付密码效果

2016/09/27 Javascript

js实现数组去重方法及效率?Ρ? target=

2017/02/14 Javascript

JS实现动态生成html table表格的方法分析

2018/07/11 Javascript

JS实现点击按钮随机生成可拖动的不同颜色块示例

2019/01/30 Javascript

vue自定义指令之面板拖拽的实现

2019/04/14 Javascript

详解Vue中的基本语法和常用指令

2019/07/23 Javascript

详细教你微信公众号正文页SVG交互开发技巧

2019/07/25 Javascript

小程序新版订阅消息模板消息

2019/12/31 Javascript

原生JavaScript实现随机点名表

2021/01/14 Javascript

python Django模板的使用方法

2016/01/14 Python

Python第三方库xlrd/xlwt的安装与读写Excel表格

2017/01/21 Python

浅谈flask中的before_request与after_request

2018/01/20 Python

python flask框架实现重定向功能示例

2019/07/02 Python

利用python实现冒泡排序算法实例代码

2019/12/01 Python

Python 保存加载mat格式文件的示例代码

2020/08/04 Python

从一次项目重构说起CSS3自定义变量在项目的使用方法

2021/03/01 HTML / CSS

类、抽象类、接口的差异

2016/06/13 面试题

override和overload的区别

2016/03/09 面试题

电气自动化自荐信

2013/10/10 职场文书

毕业生多媒体设计求职信

2013/10/12 职场文书

文艺晚会策划方案

2014/06/11 职场文书

上课随便讲话检讨书

2014/09/12 职场文书

2014年社区重阳节活动策划方案

2014/09/16 职场文书

合作协议书范本

2014/10/25 职场文书

JavaScript 实现页面滚动动画

2021/04/24 Javascript

多线程Spring通过@Scheduled实现定时任务

2022/05/25 Java/Android