Python使用struct处理二进制(pack和unpack用法)


Posted in Python onNovember 12, 2020

有的时候需要用python处理二进制数据,比如,存取文件,socket操作时.这时候,可以使用python的struct模块来完成.可以用 struct来处理c语言中的结构体.

struct模块中最重要的三个函数是pack(), unpack(), calcsize()

# 按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构体的字节流)
pack(fmt, v1, v2, ...) 
 
# 按照给定的格式(fmt)解析字节流string,返回解析出来的tuple
unpack(fmt, string)  
 
# 计算给定的格式(fmt)占用多少字节的内存
calcsize(fmt)

上述fmt中,支持的格式为:

FORMAT C TYPE PYTHON TYPE STANDARD SIZE NOTES
x pad byte no value - -
c char string of length 1 1 -
b signed char integer 1 (3)
B unsigned char integer 1 (3)
? _Bool bool 1 (1)
h short integer 2 (3)
H unsigned short integer 2 (3)
i int integer 4 (3)
I unsigned int integer 4 (3)
l long integer 4 (3) -
L unsigned long integer 4 (3)
q long long integer 8 (2), (3)
Q unsigned long long integer 8 (2), (3)
f float float 4 (4)
d double float 8 (4)
s char[] string - -
p char[] string - -
P void * integer - (5), (3)

使用方法是放在fmt的第一个位置,就像'@5s6sif'

例子1:

结构体如下:

struct Header
{
 unsigned short id;
 char[4] tag;
 unsigned int version;
 unsigned int count;
}

通过socket.recv接收到了一个上面的结构体数据,存在字符串s中,现在需要把它解析出来,可以使用unpack()函数:

import struct
id, tag, version, count = struct.unpack("!H4s2I", s)

上面的格式字符串中,!表示我们要使用网络字节顺序解析,因为我们的数据是从网络中接收到的,在网络上传送的时候它是网络字节顺序的.后面的H表示 一个unsigned short的id,4s表示4字节长的字符串,2I表示有两个unsigned int类型的数据.

就通过一个unpack,现在id, tag, version, count里已经保存好我们的信息了.

同样,也可以很方便的把本地数据再pack成struct格式:

ss = struct.pack("!H4s2I", id, tag, version, count);

pack函数就把id, tag, version, count按照指定的格式转换成了结构体Header,ss现在是一个字符串(实际上是类似于c结构体的字节流),可以通过 socket.send(ss)把这个字符串发送出去。

例子2:

import struct
 
a=12.34

# 将a变为二进制
bytes=struct.pack('i',a)

此时bytes就是一个string字符串,字符串按字节同a的二进制存储内容相同。

再进行反操作,现有二进制数据bytes,(其实就是字符串),将它反过来转换成python的数据类型:

# 注意,unpack返回的是tuple !!
a,=struct.unpack('i',bytes)

如果是由多个数据构成的,可以这样:

a='hello'
b='world!'
c=2
d=45.123

bytes=struct.pack('5s6sif',a,b,c,d)
此时的bytes就是二进制形式的数据了,可以直接写入文件比如 binfile.write(bytes)

然后,当我们需要时可以再读出来,bytes=binfile.read()

再通过struct.unpack()解码成python变量:

a,b,c,d=struct.unpack('5s6sif',bytes)

'5s6sif'这个叫做fmt,就是格式化字符串,由数字加字符构成,5s表示占5个字符的字符串,2i,表示2个整数等等,下面是可用的字符及类型,ctype表示可以与python中的类型一一对应。

注意:二进制文件处理时会碰到的问题

我们使用处理二进制文件时,需要用如下方法:

binfile=open(filepath,'rb')  #读二进制文件
 
binfile=open(filepath,'wb') #写二进制文件

那么和binfile=open(filepath,'r')的结果到底有何不同呢?

不同之处有两个地方:

第一,使用'r'的时候如果碰到'0x1A',就会视为文件结束,这就是EOF。使用'rb'则不存在这个问题。即,如果你用二进制写入再用文本读出的话,如果其中存在'0X1A',就只会读出文件的一部分。使用'rb'的时候会一直读到文件末尾。

第二,对于字符串x='abc\ndef',我们可用len(x)得到它的长度为7,\n我们称之为换行符,实际上是'0X0A'。当我们用'w'即文本方式写的时候,在windows平台上会自动将'0X0A'变成两个字符'0X0D','0X0A',即文件长度实际上变成8.。当用'r'文本方式读取时,又自动的转换成原来的换行符。如果换成'wb'二进制方式来写的话,则会保持一个字符不变,读取时也是原样读取。所以如果用文本方式写入,用二进制方式读取的话,就要考虑这多出的一个字节了。'0X0D'又称回车符。linux下不会变。因为linux只使用'0X0A'来表示换行。

以上就是Python使用struct处理二进制(pack和unpack用法)的详细内容,更多关于python struct处理二进制的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python实现多线程下载文件的代码实例
Jun 01 Python
python通过线程实现定时器timer的方法
Mar 16 Python
详解Python中time()方法的使用的教程
May 22 Python
python的concat等多种用法详解
Nov 28 Python
Python实现繁?转为简体的方法示例
Dec 18 Python
神经网络相关之基础概念的讲解
Dec 29 Python
基于OpenCV python3实现证件照换背景的方法
Mar 22 Python
python分数表示方式和写法
Jun 26 Python
python为Django项目上的每个应用程序创建不同的自定义404页面(最佳答案)
Mar 09 Python
python 通过文件夹导入包的操作
Jun 01 Python
python基于exchange函数发送邮件过程详解
Nov 06 Python
python 数据类型强制转换的总结
Jan 25 Python
python切割图片的示例
Nov 12 #Python
教你使用Sublime text3搭建Python开发环境及常用插件安装另分享Sublime text3最新激活注册码
Nov 12 #Python
Django执行源生mysql语句实现过程解析
Nov 12 #Python
Django Model层F,Q对象和聚合函数原理解析
Nov 12 #Python
在Python中字典按值排序的实现方法
Nov 12 #Python
Sublime Text3最新激活注册码分享适用2020最新版 亲测可用
Nov 12 #Python
通过代码简单了解django model序列化作用
Nov 12 #Python
You might like
利用js调用后台php进行数据处理原码
2006/10/09 PHP
基于PHP字符串的比较函数strcmp()与strcasecmp()的使用详解
2013/05/15 PHP
destoon官方标签大全
2014/06/20 PHP
PHP计算百度地图两个GPS坐标之间距离的方法
2015/01/09 PHP
在Debian系统下配置LNMP的教程
2015/07/09 PHP
浅谈php+phpStorm+xdebug配置方法
2015/09/17 PHP
PHP实现递归无限级分类
2015/10/22 PHP
php+ajax实现无刷新的新闻留言系统
2020/12/21 PHP
Jquery事件的连接使用示例
2013/06/18 Javascript
提取jquery的ready()方法单独使用示例
2014/03/25 Javascript
jQuery制作的别致导航有阴影背景高亮模式窗口
2014/04/15 Javascript
JS常用表单验证方法总结
2014/05/22 Javascript
编写简单的jQuery提示插件
2014/12/21 Javascript
JavaScript的设计模式经典之代理模式
2016/02/24 Javascript
javascript计时器编写过程与实现方法
2016/02/29 Javascript
详解Web使用webpack构建前端项目
2017/09/23 Javascript
关于AOP在JS中的实现与应用详解
2019/05/06 Javascript
详解Python的Django框架中的中间件
2015/07/24 Python
Python的自动化部署模块Fabric的安装及使用指南
2016/01/19 Python
如何使用pyinstaller打包32位的exe程序
2019/05/26 Python
Python3+Appium安装使用教程
2019/07/05 Python
python自动分箱,计算woe,iv的实例代码
2019/11/22 Python
vscode调试django项目的方法
2020/08/06 Python
应届大学生求职的自我评价
2013/11/17 职场文书
农场厂长岗位职责
2013/12/28 职场文书
医药专业应届毕业生求职信范文
2014/01/01 职场文书
员工薪酬福利制度
2014/01/17 职场文书
国际金融专业自荐信
2014/07/05 职场文书
护林员个人总结
2015/03/04 职场文书
材料采购员岗位职责
2015/04/03 职场文书
2015年酒店客房部工作总结
2015/04/25 职场文书
利用ajax+php实现商品价格计算
2021/03/31 PHP
python执行js代码的方法
2021/05/13 Python
详解CSS伪元素的妙用单标签之美
2021/05/25 HTML / CSS
MySQL系列之八 MySQL服务器变量
2021/07/02 MySQL
学习nginx基础知识
2021/09/04 Servers