编程 Python

Python标准库笔记struct模块的使用

Posted in Python onFebruary 22, 2018

最近在学习python网络编程这一块，在写简单的socket通信代码时，遇到了struct这个模块的使用，当时不太清楚这到底有和作用，后来查阅了相关资料大概了解了，在这里做一下简单的总结。

了解c语言的人，一定会知道struct结构体在c语言中的作用，它定义了一种结构，里面包含不同类型的数据(int,char,bool等等)，方便对某一结构对象进行处理。而在网络通信当中，大多传递的数据是以二进制流（binary data）存在的。当传递字符串时，不必担心太多的问题，而当传递诸如int、char之类的基本数据的时候，就需要有一种机制将某些特定的结构体类型打包成二进制流的字符串然后再网络传输，而接收端也应该可以通过某种机制进行解包还原出原始的结构体数据。python中的struct模块就提供了这样的机制，该模块的主要作用就是对python基本类型值与用python字符串格式表示的C struct类型间的转化（This module performs conversions between Python values and C structs represented as Python strings.）。stuct模块提供了很简单的几个函数，下面写几个例子。

该模块作用是完成Python数值和C语言结构体的Python字符串形式间的转换。这可以用于处理存储在文件中或从网络连接中存储的二进制数据，以及其他数据源。

用途: 在Python基本数据类型和二进制数据之间进行转换

struct模块提供了用于在字节字符串和Python原生数据类型之间转换函数，比如数字和字符串。

模块函数和Struct类

它除了提供一个Struct类之外，还有许多模块级的函数用于处理结构化的值。这里有个格式符(Format specifiers)的概念，是指从字符串格式转换为已编译的表示形式，类似于正则表达式的处理方式。通常实例化Struct类，调用类方法来完成转换，比直接调用模块函数有效的多。下面的例子都是使用Struct类。

Packing（打包）和Unpacking（解包）

Struct支持将数据packing(打包)成字符串，并能从字符串中逆向unpacking(解压)出数据。

在本例中，格式指定器(specifier)需要一个整型或长整型，一个两个字节的string,和一个浮点数。格式符中的空格用于分隔各个指示器(indicators)，在编译格式时会被忽略。

import struct

import binascii

values = (1, 'ab'.encode('utf-8'), 2.7)
s = struct.Struct('I 2s f')
packed_data = s.pack(*values)

print('原始值:', values)
print('格式符:', s.format)
print('占用字节:', s.size)
print('打包结果:', binascii.hexlify(packed_data))

# output
原始值: (1, b'ab', 2.7)
格式符: b'I 2s f'
占用字节: 12
打包结果: b'0100000061620000cdcc2c40'

这个示例将打包的值转换为十六进制字节序列，用binascii.hexlify()方法打印出来。

使用unpack()方法解包。

import struct
import binascii

packed_data = binascii.unhexlify(b'0100000061620000cdcc2c40')

s = struct.Struct('I 2s f')
unpacked_data = s.unpack(packed_data)
print('解包结果:', unpacked_data)

# output
解包结果: (1, b'ab', 2.700000047683716)

将打包的值传给unpack()，基本上返回相同的值(浮点数会有差异)。

字节顺序/大小/对齐

默认情况下，pack是使用本地C库的字节顺序来编码的。格式化字符串的第一个字符可以用来表示填充数据的字节顺序、大小和对齐方式，如下表所描述的:

Character	Byte order	Size	Alignment
@	本地	本地	本地
=	本地	standard	none
	little-endian（小字节序）	standard	none
>	big-endian（大字节序）	standard	none
!	network (= big-endian)	standard	none

如果格式符中没有设置这些，那么默认将使用 @。

本地字节顺序是指字节顺序是由当前主机系统决定。比如：Intel x86和AMD64(x86-64)使用小字节序； Motorola 68000和 PowerPC G5使用大字节序。ARM和Intel安腾支持切换字节序。可以使用sys.byteorder查看当前系统的字节顺序。

本地大小(Size)和对齐(Alignment)是由c编译器的sizeof表达式确定的。它与本地字节顺序对应。

标准大小由格式符确定，下面会讲各个格式的标准大小。

示例:

import struct
import binascii

values = (1, 'ab'.encode('utf-8'), 2.7)
print('原始值 : ', values)

endianness = [
 ('@', 'native, native'),
 ('=', 'native, standard'),
 ('<', 'little-endian'),
 ('>', 'big-endian'),
 ('!', 'network'),
]

for code, name in endianness:
 s = struct.Struct(code + ' I 2s f')
 packed_data = s.pack(*values)
 print()
 print('格式符 : ', s.format, 'for', name)
 print('占用字节: ', s.size)
 print('打包结果: ', binascii.hexlify(packed_data))
 print('解包结果: ', s.unpack(packed_data))

# output
原始值 : (1, b'ab', 2.7)

格式符 : b'@ I 2s f' for native, native
占用字节: 12
打包结果: b'0100000061620000cdcc2c40'
解包结果: (1, b'ab', 2.700000047683716)

格式符 : b'= I 2s f' for native, standard
占用字节: 10
打包结果: b'010000006162cdcc2c40'
解包结果: (1, b'ab', 2.700000047683716)

格式符 : b'< I 2s f' for little-endian
占用字节: 10
打包结果: b'010000006162cdcc2c40'
解包结果: (1, b'ab', 2.700000047683716)

格式符 : b'> I 2s f' for big-endian
占用字节: 10
打包结果: b'000000016162402ccccd'
解包结果: (1, b'ab', 2.700000047683716)

格式符 : b'! I 2s f' for network
占用字节: 10
打包结果: b'000000016162402ccccd'
解包结果: (1, b'ab', 2.700000047683716)

格式符

格式符对照表如下:

Format	C Type	Python type	Standard size	Notes
x	pad byte	no value
c	char	bytes of length 1	1
b	signed char	integer	1	(1),(3)
B	unsigned char	integer	1	(3)
?	_Bool	bool	1	(1)
h	short	integer	2	(3)
H	unsigned short	integer	2	(3)
i	int	integer	4	(3)
I	unsigned int	integer	4	(3)
l	long	integer	4	(3)
L	unsigned long	integer	4	(3)
q	long long	integer	8	(2), (3)
Q	unsigned long long	integer	8	(2), (3)
n	ssize_t	integer	(4)
N	size_t	integer	(4)
f	float	float	4	(5)
d	double	float	8	(5)
s	char[]	bytes
p	char[]	bytes
P	void *	integer		(6)

缓冲区

将数据打包成二进制通常是用在对性能要求很高的场景。

在这类场景中可以通过避免为每个打包结构分配新缓冲区的开销来优化。

pack_into()和unpack_from()方法支持直接写入预先分配的缓冲区。

import array
import binascii
import ctypes
import struct

s = struct.Struct('I 2s f')
values = (1, 'ab'.encode('utf-8'), 2.7)
print('原始值:', values)

print()
print('使用ctypes模块string buffer')

b = ctypes.create_string_buffer(s.size)
print('原始buffer :', binascii.hexlify(b.raw))
s.pack_into(b, 0, *values)
print('打包结果写入 :', binascii.hexlify(b.raw))
print('解包  :', s.unpack_from(b, 0))

print()
print('使用array模块')

a = array.array('b', b'\0' * s.size)
print('原始值 :', binascii.hexlify(a))
s.pack_into(a, 0, *values)
print('打包写入 :', binascii.hexlify(a))
print('解包  :', s.unpack_from(a, 0))

# output
原始值: (1, b'ab', 2.7)

使用ctypes模块string buffer
原始buffer : b'000000000000000000000000'
打包结果写入 : b'0100000061620000cdcc2c40'
解包        : (1, b'ab', 2.700000047683716)

使用array模块
原始值   : b'000000000000000000000000'
打包写入 : b'0100000061620000cdcc2c40'
解包     : (1, b'ab', 2.700000047683716)

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python标准库笔记struct模块的使用

- Author -

j_hao104

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python 正则式使用心得

May 07 Python

python实现复制整个目录的方法

May 12 Python

Linux系统上Nginx+Python的web.py与Django框架环境

Dec 25 Python

python实现分页效果

Oct 25 Python

Python语言描述KNN算法与Kd树

Dec 13 Python

教你用Python写安卓游戏外挂

Jan 11 Python

Python自定义函数实现求两个数最大公约数、最小公倍数示例

May 21 Python

python获取Pandas列名的几种方法

Aug 07 Python

python框架Django实战商城项目之工程搭建过程图文详解

Mar 09 Python

Python中flatten( ),matrix.A用法说明

Jul 05 Python

python实现双人五子棋（终端版）

Dec 30 Python

Python使用pyecharts控件绘制图表

Jun 05 Python

python实现手机通讯录搜索功能

Feb 22 #Python

Python实现通讯录功能

Feb 22 #Python

Python SQLite3简介

Feb 22 #Python

Python Web程序部署到Ubuntu服务器上的方法

Feb 22 #Python

Python中传递值和传递引用的区别解析

Feb 22 #Python

centos 安装python3.6环境并配置虚拟环境的详细教程

Feb 22 #Python

windows下安装python的C扩展编译环境(解决Unable to find vcvarsall.bat)

Feb 21 #Python

You might like

php+mysql事务rollback&commit示例

2010/02/08 PHP

PHP实现视频文件上传完整实例

2014/08/28 PHP

PHP+jQuery 注册模块的改进（一）：验证码存入SESSION

2014/10/14 PHP

PHP程序员常见的40个陋习,你中了几个？

2014/11/20 PHP

php基于websocket搭建简易聊天室实践

2016/10/24 PHP

PHP大文件切割上传并带进度条功能示例

2019/07/01 PHP

ASP.NET jQuery 实例8 (动态添加内容到DropDownList)

2012/02/03 Javascript

利用javascript实现web页面中指定区域打印

2013/10/30 Javascript

基于NodeJS的前后端分离的思考与实践（四）安全问题解决方案

2014/09/26 NodeJs

jQuery中iframe的操作(点击按钮新增窗口)

2016/04/20 Javascript

vue实现可增删查改的成绩单

2016/10/27 Javascript

javascript数组去重方法分析

2016/12/15 Javascript

javascript构造函数以及原型对象的理解

2017/01/13 Javascript

JSONP基础知识详解

2017/03/19 Javascript

Node.JS 循环递归复制文件夹目录及其子文件夹下的所有文件

2017/09/18 Javascript

Angularjs 手写日历的实现代码（不用插件）

2017/10/18 Javascript

判断文字超过2行添加展开按钮，未超过则不显示，溢出部分显示省略号

2019/04/28 Javascript

详解Vue中的基本语法和常用指令

2019/07/23 Javascript

vue下使用nginx刷新页面404的问题解决

2019/08/02 Javascript

vue-cli3 取消eslint校验代码的解决办法

2020/01/16 Javascript

ant design vue中日期选择框混合时间选择器的用法说明

2020/10/27 Javascript

Antd中单个DatePicker限定时间输入范围操作

2020/10/29 Javascript

浅谈django model postgres的json字段编码问题

2018/01/05 Python

Python爬虫通过替换http request header来欺骗浏览器实现登录功能

2018/01/07 Python

python Opencv将图片转为字符画

2021/02/19 Python

Python 3.x基于Xml数据的Http请求方法

2018/12/28 Python

Python3 pip3 list 出现 DEPRECATION 警告的解决方法

2019/02/16 Python

HTML的form表单和django的form表单

2019/07/25 Python

Django单元测试工具test client使用详解

2019/08/02 Python

TensorFlow tf.nn.max_pool实现池化操作方式

2020/01/04 Python

django从后台返回html代码的实例

2020/03/11 Python

python求前n个阶乘的和实例

2020/04/02 Python

Myprotein瑞典官方网站：畅销欧洲英国运动营养品牌

2018/01/22 全球购物

2014年党建工作总结

2014/11/11 职场文书

学术会议邀请函

2015/01/30 职场文书

python自然语言处理之字典树知识总结

2021/04/25 Python