使用Python进行二进制文件读写的简单方法(推荐)


Posted in Python onSeptember 12, 2016

总的感觉,python本身并没有对二进制进行支持,不过提供了一个模块来弥补,就是struct模块。

python没有二进制类型,但可以存储二进制类型的数据,就是用string字符串类型来存储二进制数据,这也没关系,因为string是以1个字节为单位的。

import struct

a=12.34

#将a变为二进制

bytes=struct.pack('i',a)

此时bytes就是一个string字符串,字符串按字节同a的二进制存储内容相同。

再进行反操作

现有二进制数据bytes,(其实就是字符串),将它反过来转换成python的数据类型:

a,=struct.unpack('i',bytes)

注意,unpack返回的是tuple

所以如果只有一个变量的话:

bytes=struct.pack('i',a)

那么,解码的时候需要这样

a,=struct.unpack('i',bytes) 或者 (a,)=struct.unpack('i',bytes)

如果直接用a=struct.unpack('i',bytes),那么 a=(12.34,) ,是一个tuple而不是原来的浮点数了。

如果是由多个数据构成的,可以这样:

a='hello'

b='world!'

c=2

d=45.123

bytes=struct.pack('5s6sif',a,b,c,d)

此时的bytes就是二进制形式的数据了,可以直接写入文件比如 binfile.write(bytes)

然后,当我们需要时可以再读出来,bytes=binfile.read()

再通过struct.unpack()解码成python变量

a,b,c,d=struct.unpack('5s6sif',bytes)

'5s6sif'这个叫做fmt,就是格式化字符串,由数字加字符构成,5s表示占5个字符的字符串,2i,表示2个整数等等,下面是可用的字符及类型,ctype表示可以与python中的类型一一对应。

Format C Type Python 字节数
x pad byte no value 1
c char string of length 1 1
b signed char integer 1
B unsigned char integer 1
? _Bool bool 1
h short integer 2
H unsigned short integer 2
i int integer 4
I unsigned int integer or long 4
l long integer 4
L unsigned long long 4
q long long long 8
Q unsigned long long long 8
f float float 4
d double float 8
s char[] string 1
p char[] string 1
P void * long

最后一个可以用来表示指针类型的,占4个字节

为了同c中的结构体交换数据,还要考虑有的c或c++编译器使用了字节对齐,通常是以4个字节为单位的32位系统,故而还提供了

Character Byte order Size and alignment
@ native native            凑够4个字节
= native standard        按原字节数
little-endian standard        按原字节数
> big-endian standard       按原字节数
! network (= big-endian) standard       按原字节数

使用方法是放在fmt的第一个位置,就像'@5s6sif'

-----二进制文件处理时会碰到的问题-----

我们使用处理二进制文件时,需要用如下方法

binfile=open(filepath,'rb')    读二进制文件

binfile=open(filepath,'wb')    写二进制文件

那么和binfile=open(filepath,'r')的结果到底有何不同呢?

不同之处有两个地方:

第一,使用'r'的时候如果碰到'0x1A',就会视为文件结束,这就是EOF。使用'rb'则不存在这个问题。即,如果你用二进制写入再用文本读出的话,如果其中存在'0X1A',就只会读出文件的一部分。使用'rb'的时候会一直读到文件末尾。

第二,对于字符串x='abc/ndef',我们可用len(x)得到它的长度为7,/n我们称之为换行符,实际上是 '0X0A'。当我们用'w' 即文本方式写的时候,在windows平台上会自动将'0X0A'变成两个字符'0X0D','0X0A',即文件长度实际上变成8.。当用'r'文本方式读取时,又自动的转换成原来的换行符。如果换成'wb'二进制方式来写的话,则会保持一个字符不变,读取时也是原样读取。所以如果用文本方式写入,用二进制方式读取的话,就要考虑这多出的一个字节了。'0X0D'又称回车符。
linux下不会变。因为linux只使用'0X0A'来表示换行。

以上这篇使用Python进行二进制文件读写的简单方法(推荐)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
github配置使用指南
Nov 18 Python
python简单商城购物车实例代码
Mar 15 Python
对Python中DataFrame按照行遍历的方法
Apr 08 Python
对python中的for循环和range内置函数详解
Apr 17 Python
pyqt5实现登录界面的模板
May 30 Python
Python用Try语句捕获异常的实例方法
Jun 26 Python
python构建指数平滑预测模型示例
Nov 21 Python
Jupyter notebook如何修改平台字体
May 13 Python
Pytorch 扩展Tensor维度、压缩Tensor维度的方法
Sep 09 Python
Python colormap库的安装和使用详情
Oct 06 Python
python利用opencv实现颜色检测
Feb 23 Python
Python借助with语句实现代码段只执行有限次
Mar 23 Python
浅谈python对象数据的读写权限
Sep 12 #Python
python获取list下标及其值的简单方法
Sep 12 #Python
Python循环语句中else的用法总结
Sep 11 #Python
python字典键值对的添加和遍历方法
Sep 11 #Python
解决Python 遍历字典时删除元素报异常的问题
Sep 11 #Python
完美解决python遍历删除字典里值为空的元素报错问题
Sep 11 #Python
python 循环遍历字典元素的简单方法
Sep 11 #Python
You might like
php数组函数序列之prev() - 移动数组内部指针到上一个元素的位置,并返回该元素值
2011/10/31 PHP
PHP删除HTMl标签的实现代码
2013/06/30 PHP
php上传文件中文文件名乱码的解决方法
2013/11/01 PHP
PHP实现多图片上传类实例
2014/07/26 PHP
在laravel框架中使用model层的方法
2019/10/08 PHP
JS中简单的实现像C#中using功能(有源码下载)
2007/01/09 Javascript
js 父窗口控制子窗口的行为-打开,关闭,重定位,回复
2010/04/20 Javascript
SOSO地图JS画出标注和中心点以html形式运行
2013/08/09 Javascript
AngularJS的内置过滤器详解
2015/05/14 Javascript
详解JavaScript中void语句的使用
2015/06/04 Javascript
uploadify多文件上传参数设置技巧
2015/11/16 Javascript
微信小程序日历组件calendar详解及实例
2017/06/08 Javascript
JavaScript标准对象_动力节点Java学院整理
2017/06/27 Javascript
React学习之事件绑定的几种方法对比
2017/09/24 Javascript
微信小程序websocket实现聊天功能
2020/03/30 Javascript
从源码里了解vue中的nextTick的使用
2018/11/22 Javascript
对TypeScript库进行单元测试的方法
2019/07/18 Javascript
vue style width a href动态拼接问题的解决
2020/08/07 Javascript
Vue使用screenfull实现全屏效果
2020/09/17 Javascript
js观察者模式的弹幕案例
2020/11/23 Javascript
[01:00:14]DOTA2官方TI8总决赛纪录片 真视界True Sight
2019/01/16 DOTA
Python单元测试框架unittest使用方法讲解
2015/04/13 Python
python中常用检测字符串相关函数汇总
2015/04/15 Python
详解python进行mp3格式判断
2016/12/23 Python
详解Django-restframework 之频率源码分析
2019/02/27 Python
Python pip替换为阿里源的方法步骤
2019/07/02 Python
Python PO设计模式的具体使用
2019/08/16 Python
tensorflow 实现数据类型转换
2020/02/17 Python
python DES加密与解密及hex输出和bs64格式输出的实现代码
2020/04/13 Python
python中如何写类
2020/06/29 Python
Pandas之缺失数据的实现
2021/01/06 Python
小学校长竞聘演讲稿
2014/05/16 职场文书
2014年节能降耗工作总结
2014/12/11 职场文书
学生检讨书
2015/01/27 职场文书
人事行政主管岗位职责
2015/04/09 职场文书
Java Dubbo框架知识点梳理
2021/06/26 Java/Android