php读取二进制流(C语言结构体struct数据文件)的深入解析


Posted in PHP onJune 13, 2013

尽管php是用C语言开发的,不过令我不解的是php没有提供对结构体struct的直接支持。
不过php提供了pack和unpack函数,用来进行二进制数据(binary data)和php内部数据的互转:

string pack ( string $format [, mixed $args [, mixed $...]] )  
 //Pack given arguments into binary string according to format.  
array unpack ( string $format, string $data )  
//Unpacks from a binary string into an array according to the given format.

其中,$format跟perl里的pack格式类似,有如下一些(中文是我加的,有不准确的欢迎提出):
a NUL-padded string,即“\0”作为“空字符”的表示形式
A SPACE-padded string,空格作为“空字符”的表示形式
h Hex string, low nibble first,升序位顺序
H Hex string, high nibble first,降序位顺序
c signed char,有符号单字节
C unsigned char,无符号单字节
s signed short (always 16 bit, machine byte order)
S unsigned short (always 16 bit, machine byte order)
n unsigned short (always 16 bit, big endian byte order)
v unsigned short (always 16 bit, little endian byte order)
i signed integer (machine dependent size and byte order)
I unsigned integer (machine dependent size and byte order)
l signed long (always 32 bit, machine byte order)
L unsigned long (always 32 bit, machine byte order)
N unsigned long (always 32 bit, big endian byte order)
V unsigned long (always 32 bit, little endian byte order)
f float (machine dependent size and representation)
d double (machine dependent size and representation)
x NUL byte,实际使用的时候作为跳过多少字节用,很有用
X Back up one byte,后退1字节
@ NUL-fill to absolute position,实际使用的时候作为从开头跳到某字节用,很有用
实际使用发现:C里的“\0”(即字符串终止符)在php里并不是终止符,而是作为了字符串的一部分。因此,必须对“\0”进行特殊处理,才能进行struct和php内部数据的完美互转。比如 char name[10]; 如果实际数据是“62 69 61 6E 00 62 69 616E00”,在C语言里第5个位置有终止符,name应该是“bian”;而用了unpack转换以后在php里的name却是“bian\0bian\0”。
一开始我用了strpos函数找到“\0”的位置,然后进行substr截取.

不过很Faint的事情发生了,不知道是strpos的bug还是substr的bug(其实测试一下就知道,懒得试),有些字符串没问题,有些字符串却只能得到空值(即$name == ”)。很是郁闷,后来找了个strtok函数,这下没有问题了.
难为大家看了那么多,下面写个完整的php读取二进制数据流(C语言结构体struct数据)文件的示例代码:
首先是C的struct定义示例,为了演示,我就写个简单点的,实际对照上面那个$format格式表应该没有问题:

struct BIANBIAN {  
    char name[10];  
    char pass[33];  
    int  age;  
    unsigned char flag;  
};

比如有个“file.dat”文件,内容就是上面的N个BIANBIAN结构体构成的。读取的php代码:
    <?php  
     //下面根据struct确定$format,注意int类型跟机器环境有关,我的32位Linux是4个长度  
     $format = 'a10name/a33pass/iage/Cflag';  
     //确定一个struct占用多少长度字节,如果只是读取单个结构体这是不需要的  
     $length = 10 + 33 + 4 + 1;  
     //也可以用fopen + fread + fclose,不过file_get_contents因为可以mmap,效率更高  
     $data = file_get_contents('file.dat', 'r');  
     for ($i = 0, $c = strlen($data); $i < $c; $i += $length) {  
         $bianbian = unpack("$format", $data);  
         //reference传递是php 5才支持的,如果用php4,得用其他办法  
         foreach ($bianbian as &$value) {  
             if (is_string($value)) {  
                 $value = strtok($value, "\0");  
             }  
         }  
         print_r($bianbian);  
     }  
    ?> 

pack应该跟unpack相反。
顺便附上生成结构体文件的C语言代码:
    #include <stdio.h>  
    #include <string.h>      struct example       
    {      
        char name[10];  
        char pass[33];  
        int  age;  
        unsigned char flag;  
    };  
    int main()     
    {  
        example test;  
        example read;     
        FILE *fp;  
        test.age = 111;     
        test.flag = 10;  
        strcpy(test.name, "Hello World!");  
        strcpy(test.pass, "zbl110119");  
        fp = fopen("file.dat", "w+");  
        if (!fp)  
        {  
            printf("open file error!");  
            return -1;  
        }  
        rewind(fp);  
        fwrite(&test, sizeof(example), 1, fp);  
        rewind(fp);  
        fread(&read, sizeof(example), 1, fp);  
        printf("%d, %s\n", read.age, read.name);  
        fclose(fp);  
        return 0;  
    } 

PHP 相关文章推荐
php 中文和编码判断代码
May 16 PHP
php 错误处理经验分享
Oct 11 PHP
PHP取进制余数函数代码
Jan 19 PHP
利用PHP生成静态HTML文档的原理
Oct 29 PHP
PHPMailer使用教程(PHPMailer发送邮件实例分析)
Dec 06 PHP
ini_set的用法介绍
Jan 07 PHP
PHP取余函数介绍MOD(x,y)与x%y
May 15 PHP
php文件上传简单实现方法
Jan 24 PHP
php post大量数据时发现数据丢失问题解决方法
Jun 20 PHP
在WordPress的文章编辑器中设置默认内容的方法
Dec 29 PHP
PHP多进程编程总结(推荐)
Jul 18 PHP
使用Codeigniter重写insert的方法(推荐)
Mar 23 PHP
基于PHP Socket配置以及实例的详细介绍
Jun 13 #PHP
深入php socket的讲解与实例分析
Jun 13 #PHP
PHP数据类型的总结分析
Jun 13 #PHP
如何用C语言编写PHP扩展的详解
Jun 13 #PHP
探讨:如何编写PHP扩展
Jun 13 #PHP
PHP APC的安装与使用详解
Jun 13 #PHP
eAccelerator的安装与使用详解
Jun 13 #PHP
You might like
php去掉文件前几行的方法
2015/07/29 PHP
解决form中action属性后面?传递参数 获取不到的问题
2017/07/21 PHP
visual studio code 调试php方法(图文详解)
2017/09/15 PHP
jquery ui dialog里调用datepicker的问题
2009/08/06 Javascript
jquery 仿QQ校友的DIV模拟窗口效果源码
2010/03/24 Javascript
输入密码检测大写是否锁定js实现代码
2012/12/03 Javascript
js切换div css注意的细节
2012/12/10 Javascript
javascript框架设计读书笔记之种子模块
2014/12/02 Javascript
使用jQuery处理AJAX请求的基础学习教程
2016/05/10 Javascript
全面了解JS中的匿名函数
2016/06/29 Javascript
js实现的光标位置工具函数示例
2016/10/03 Javascript
关于axios如何全局注册浅析
2018/01/14 Javascript
nodejs实现用户登录路由功能
2019/05/22 NodeJs
一篇文章弄懂javascript中的执行栈与执行上下文
2019/08/09 Javascript
Vue 中使用富文本编译器wangEditor3的方法
2019/09/26 Javascript
JavaScript 作用域scope简单汇总
2019/10/23 Javascript
JavaScript实现简单验证码
2020/08/24 Javascript
[56:56]VG vs LGD 2019国际邀请赛淘汰赛 胜者组 BO3 第一场 8.22
2019/09/05 DOTA
python生成日历实例解析
2014/08/21 Python
Python找出9个连续的空闲端口
2016/02/01 Python
python shell根据ip获取主机名代码示例
2017/11/25 Python
利用Django-environ如何区分不同环境
2018/08/26 Python
使用python Fabric动态修改远程机器hosts的方法
2018/10/26 Python
Django中reverse反转并且传递参数的方法
2019/08/06 Python
如何基于Python + requests实现发送HTTP请求
2020/01/13 Python
Python 3.8 新功能来一波(大部分人都不知道)
2020/03/11 Python
Python并发concurrent.futures和asyncio实例
2020/05/04 Python
python中用ggplot绘制画图实例讲解
2021/01/26 Python
英国办公用品商店:Office Outlet
2018/04/04 全球购物
您的时尚,您的生活方式:DTLR Villa
2019/12/25 全球购物
聚网科技C++面试笔试题
2015/09/01 面试题
产品促销活动策划书
2014/01/15 职场文书
国际残疾人日广播稿范文
2014/10/09 职场文书
《7的乘法口诀》教学反思
2016/02/18 职场文书
selenium.webdriver中add_argument方法常用参数表
2021/04/08 Python
插件导致ECharts被全量引入的坑示例解析
2022/09/23 Javascript