php读取二进制流(C语言结构体struct数据文件)的深入解析


Posted in PHP onJune 13, 2013

尽管php是用C语言开发的,不过令我不解的是php没有提供对结构体struct的直接支持。
不过php提供了pack和unpack函数,用来进行二进制数据(binary data)和php内部数据的互转:

string pack ( string $format [, mixed $args [, mixed $...]] )  
 //Pack given arguments into binary string according to format.  
array unpack ( string $format, string $data )  
//Unpacks from a binary string into an array according to the given format.

其中,$format跟perl里的pack格式类似,有如下一些(中文是我加的,有不准确的欢迎提出):
a NUL-padded string,即“\0”作为“空字符”的表示形式
A SPACE-padded string,空格作为“空字符”的表示形式
h Hex string, low nibble first,升序位顺序
H Hex string, high nibble first,降序位顺序
c signed char,有符号单字节
C unsigned char,无符号单字节
s signed short (always 16 bit, machine byte order)
S unsigned short (always 16 bit, machine byte order)
n unsigned short (always 16 bit, big endian byte order)
v unsigned short (always 16 bit, little endian byte order)
i signed integer (machine dependent size and byte order)
I unsigned integer (machine dependent size and byte order)
l signed long (always 32 bit, machine byte order)
L unsigned long (always 32 bit, machine byte order)
N unsigned long (always 32 bit, big endian byte order)
V unsigned long (always 32 bit, little endian byte order)
f float (machine dependent size and representation)
d double (machine dependent size and representation)
x NUL byte,实际使用的时候作为跳过多少字节用,很有用
X Back up one byte,后退1字节
@ NUL-fill to absolute position,实际使用的时候作为从开头跳到某字节用,很有用
实际使用发现:C里的“\0”(即字符串终止符)在php里并不是终止符,而是作为了字符串的一部分。因此,必须对“\0”进行特殊处理,才能进行struct和php内部数据的完美互转。比如 char name[10]; 如果实际数据是“62 69 61 6E 00 62 69 616E00”,在C语言里第5个位置有终止符,name应该是“bian”;而用了unpack转换以后在php里的name却是“bian\0bian\0”。
一开始我用了strpos函数找到“\0”的位置,然后进行substr截取.

不过很Faint的事情发生了,不知道是strpos的bug还是substr的bug(其实测试一下就知道,懒得试),有些字符串没问题,有些字符串却只能得到空值(即$name == ”)。很是郁闷,后来找了个strtok函数,这下没有问题了.
难为大家看了那么多,下面写个完整的php读取二进制数据流(C语言结构体struct数据)文件的示例代码:
首先是C的struct定义示例,为了演示,我就写个简单点的,实际对照上面那个$format格式表应该没有问题:

struct BIANBIAN {  
    char name[10];  
    char pass[33];  
    int  age;  
    unsigned char flag;  
};

比如有个“file.dat”文件,内容就是上面的N个BIANBIAN结构体构成的。读取的php代码:
    <?php  
     //下面根据struct确定$format,注意int类型跟机器环境有关,我的32位Linux是4个长度  
     $format = 'a10name/a33pass/iage/Cflag';  
     //确定一个struct占用多少长度字节,如果只是读取单个结构体这是不需要的  
     $length = 10 + 33 + 4 + 1;  
     //也可以用fopen + fread + fclose,不过file_get_contents因为可以mmap,效率更高  
     $data = file_get_contents('file.dat', 'r');  
     for ($i = 0, $c = strlen($data); $i < $c; $i += $length) {  
         $bianbian = unpack("$format", $data);  
         //reference传递是php 5才支持的,如果用php4,得用其他办法  
         foreach ($bianbian as &$value) {  
             if (is_string($value)) {  
                 $value = strtok($value, "\0");  
             }  
         }  
         print_r($bianbian);  
     }  
    ?> 

pack应该跟unpack相反。
顺便附上生成结构体文件的C语言代码:
    #include <stdio.h>  
    #include <string.h>      struct example       
    {      
        char name[10];  
        char pass[33];  
        int  age;  
        unsigned char flag;  
    };  
    int main()     
    {  
        example test;  
        example read;     
        FILE *fp;  
        test.age = 111;     
        test.flag = 10;  
        strcpy(test.name, "Hello World!");  
        strcpy(test.pass, "zbl110119");  
        fp = fopen("file.dat", "w+");  
        if (!fp)  
        {  
            printf("open file error!");  
            return -1;  
        }  
        rewind(fp);  
        fwrite(&test, sizeof(example), 1, fp);  
        rewind(fp);  
        fread(&read, sizeof(example), 1, fp);  
        printf("%d, %s\n", read.age, read.name);  
        fclose(fp);  
        return 0;  
    } 

PHP 相关文章推荐
收集的php编写大型网站问题集
Mar 06 PHP
PHP最常用的ini函数分析 针对PHP.ini配置文件
Apr 22 PHP
理解和运用PHP中的多态性[译]
Aug 02 PHP
解析PHP跨站刷票的实现代码
Jun 18 PHP
php 常用算法和时间复杂度
Jul 01 PHP
PHP怎么实现网站保存快捷方式方便用户随时浏览
Aug 15 PHP
php操作redis中的hash和zset类型数据的方法和代码例子
Jul 05 PHP
PHP操作Postgresql封装类与应用完整实例
Apr 24 PHP
PHP实现小程序批量通知推送
Nov 27 PHP
PHP array_shift()用法实例分析
Jan 07 PHP
在Laravel中使用GuzzleHttp调用第三方服务的API接口代码
Oct 15 PHP
PHP实现文件上传与下载
Aug 28 PHP
基于PHP Socket配置以及实例的详细介绍
Jun 13 #PHP
深入php socket的讲解与实例分析
Jun 13 #PHP
PHP数据类型的总结分析
Jun 13 #PHP
如何用C语言编写PHP扩展的详解
Jun 13 #PHP
探讨:如何编写PHP扩展
Jun 13 #PHP
PHP APC的安装与使用详解
Jun 13 #PHP
eAccelerator的安装与使用详解
Jun 13 #PHP
You might like
一个简单的PHP入门源程序
2006/10/09 PHP
基于PHP实现通过照片获取ip地址
2016/04/26 PHP
项目中应用Redis+Php的场景
2016/05/22 PHP
php添加数据到xml文件的简单例子
2016/09/08 PHP
php+redis实现多台服务器内网存储session并读取示例
2017/01/12 PHP
ExtJs 表单提交登陆实现代码
2010/08/19 Javascript
window.navigate 与 window.location.href 的使用区别介绍
2013/09/21 Javascript
js脚本获取webform服务器控件的方法
2014/05/16 Javascript
JS实现至少包含字母、大小写数字、字符的密码等级的两种方法
2015/02/03 Javascript
谈谈我对JavaScript原型和闭包系列理解(随手笔记6)
2015/12/20 Javascript
关于获取DIV内部内容报错的原因分析及解决办法
2016/01/29 Javascript
利用angular.copy取消变量的双向绑定与解析
2016/11/25 Javascript
解决Vue页面固定滚动位置的处理办法
2017/07/13 Javascript
Angular4学习笔记之准备和环境搭建项目
2017/08/01 Javascript
Popup弹出框添加数据实现方法
2017/10/27 Javascript
jQuery中的$是什么意思及 $. 和 $().的区别
2018/04/20 jQuery
jQuery实现列表的增加和删除功能
2018/06/14 jQuery
jQuery实现的老虎机跑动效果示例
2018/12/29 jQuery
jquery的$().each和$.each的区别
2019/01/18 jQuery
vue+express+jwt持久化登录的方法
2019/06/14 Javascript
Vue项目中使用better-scroll实现菜单映射功能方法
2019/09/11 Javascript
将RGB值转换为灰度值的简单算法
2019/10/09 Javascript
微信小程序基于movable-view实现滑动删除效果
2020/01/08 Javascript
python微信跳一跳系列之棋子定位像素遍历
2018/02/26 Python
python实现日志按天分割
2019/07/22 Python
python 项目目录结构设置
2020/02/14 Python
python中os包的用法
2020/06/01 Python
乐高西班牙官方商店:LEGO Shop ES
2019/12/01 全球购物
大学生学习2014年全国两会心得体会
2014/03/12 职场文书
农业局党的群众路线教育实践活动整改方案
2014/09/20 职场文书
银行竞聘报告范文
2014/11/06 职场文书
公司庆典欢迎词
2015/01/26 职场文书
英文商务邀请函范文
2015/01/31 职场文书
Nginx配置并兼容HTTP实现代码解析
2021/03/31 Servers
MySQL 表空间碎片的概念及相关问题解决
2021/05/07 MySQL
缓存替换策略及应用(以Redis、InnoDB为例)
2021/07/25 Redis