编程 PHP

PHP浮点数的一个常见问题

Posted in PHP onMarch 10, 2016

PHP是一种弱类型语言, 这样的特性, 必然要求有无缝透明的隐式类型转换, PHP内部使用zval来保存任意类型的数值, zval的结构如下(5.2为例):

struct _zval_struct {
 /* Variable information */
 zvalue_value value;  /* value */
 zend_uint refcount;
 zend_uchar type; /* active type */
 zend_uchar is_ref;
};

上面的结构中, 实际保存数值本身的是zvalue_value联合体:

typedef union _zvalue_value {
 long lval;     /* long value */
 double dval;    /* double value */
 struct {
  char *val;
  int len;
 } str;
 HashTable *ht;    /* hash table value */
 zend_object_value obj;
} zvalue_value;

今天的话题, 我们只关注其中的俩个成员, lval和dval, 我们要意识到, long lval是随着编译器, OS的字长不同而不定长的, 它有可能是32bits或者64bits, 而double dval(双精度)由IEEE 754规定, 是定长的, 一定是64bits.

请记住这一点, 造就了PHP的一些代码的”非平台无关性”. 我们接下来的讨论, 除了特别指明, 都是假设long为64bits

IEEE 754的浮点计数法, 我这里就不引用了, 大家有兴趣的可以自己查看, 关键的一点是, double的尾数采用52位bit来保存, 算上隐藏的1位有效位, 一共是53bits.

在这里, 引出一个很有意思的问题, 我们用c代码举例(假设long为64bits):

long a = x;
 assert(a == (long)(double)a);

请问, a的取值在什么范围内的时候, 上面的代码可以断言成功?(留在文章最后解答)

现在我们回归正题, PHP在执行一个脚本之前, 首先需要读入脚本, 分析脚本, 这个过程中也包含着, 对脚本中的字面量进行zval化, 比如对于如下脚本:

<?php
$a = 9223372036854775807; //64位有符号数最大值
$b = 9223372036854775808; //最大值+1
var_dump($a);
var_dump($b);

输出:

int(9223372036854775807)
float(9.22337203685E+18)

也就说, PHP在词法分析阶段, 对于一个字面量的数值, 会去判断, 是否超出了当前系统的long的表值范围, 如果不是, 则用lval来保存, zval为IS_LONG, 否则就用dval表示, zval IS_FLOAT.

凡是大于最大的整数值的数值, 我们都要小心, 因为它可能会有精度损失:

<?php
$a = 9223372036854775807;
$b = 9223372036854775808;
 
var_dump($a === ($b - 1));

输出是false.

现在接上开头的讨论, 之前说过, PHP的整数, 可能是32位, 也可能是64位, 那么就决定了, 一些在64位上可以运行正常的代码, 可能会因为隐形的类型转换, 发生精度丢失, 从而造成代码不能正常的运行在32位系统上.

所以, 我们一定要警惕这个临界值, 好在PHP中已经定义了这个临界值:

<?php
 echo PHP_INT_MAX;
 ?>

当然, 为了保险起见, 我们应该使用字符串来保存大整数, 并且采用比如bcmath这样的数学函数库来进行计算.

另外, 还有一个关键的配置, 会让我们产生迷惑, 这个配置就是php.precision, 这配置决定了PHP再输出一个float值的时候, 输出多少有效位.

最后, 我们再来回头看上面提出的问题, 也就是一个long的整数, 最大的值是多少, 才能保证转到float以后再转回long不会发生精度丢失?

比如, 对于整数, 我们知道它的二进制表示是, 101, 现在, 让我们右移俩位, 变成1.01, 舍去高位的隐含有效位1, 我们得到在double中存储5的二进制数值为:

0/*符号位*/ 10000000001/*指数位*/ 0100000000000000000000000000000000000000000000000000
5的二进制表示, 丝毫未损的保存在了尾数部分, 这个情况下, 从double转会回long, 不会发生精度丢失.

我们知道double用52位表示尾数, 算上隐含的首位1, 一共是53位精度.. 那么也就可以得出, 如果一个long的整数, 值小于:

2^53 - 1 == 9007199254740991; //牢记, 我们现在假设是64bits的long
那么, 这个整数, 在发生long->double->long的数值转换时, 不会发生精度丢失.

关于浮点数，还有一点,就是对于如下的这个常见问题的回答:

<?php
 $f = 0.58;
 var_dump(intval($f * 100)); //为啥输出57
?>

为啥输出是57啊? PHP的bug么?

我相信有很多的同学有过这样的疑问, 因为光问我类似问题的人就很多, 更不用说bugs.php.net上经常有人问…

要搞明白这个原因, 首先我们要知道浮点数的表示(IEEE 754):

浮点数, 以64位的长度(双精度)为例, 会采用1位符号位(E), 11指数位(Q), 52位尾数(M)表示(一共64位).

符号位：最高位表示数据的正负，0表示正数，1表示负数。

指数位：表示数据以2为底的幂，指数采用偏移码表示

尾数：表示数据小数点后的有效数字.

这里的关键点就在于, 小数在二进制的表示, 关于小数如何用二进制表示, 大家可以百度一下, 我这里就不再赘述, 我们关键的要了解, 0.58 对于二进制表示来说, 是无限长的值(下面的数字省掉了隐含的1)..

0.58的二进制表示基本上(52位)是: 0010100011110101110000101000111101011100001010001111
0.57的二进制表示基本上(52位)是: 0010001111010111000010100011110101110000101000111101

而两者的二进制, 如果只是通过这52位计算的话,分别是:

0.58 -> 0.57999999999999996
0.57 -> 0.56999999999999995

至于0.58 * 100的具体浮点数乘法, 我们不考虑那么细, 有兴趣的可以看(Floating point), 我们就模糊的以心算来看… 0.58 * 100 = 57.999999999

那你intval一下, 自然就是57了….

可见, 这个问题的关键点就是: “你看似有穷的小数, 在计算机的二进制表示里却是无穷的”

so, 不要再以为这是PHP的bug了, 这就是这样的…..

PHP浮点数的一个常见问题

- Author -

Laruence

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

PHP 相关文章推荐

PHP 采集获取指定网址的内容

Jan 05 PHP

比较全面的PHP数组的使用方法小结

Sep 23 PHP

有关php运算符的知识大全

Nov 03 PHP

JoshChen_web格式编码UTF8-无BOM的小细节分析

Aug 16 PHP

百度站点地图(百度sitemap)生成方法分享

Jan 09 PHP

php GUID生成函数和类

Mar 10 PHP

thinkphp3.2.2前后台公用类架构问题分析

Nov 25 PHP

PHP+MySQL插入操作实例

Jan 21 PHP

利用PHP将部分内容用星号替换

Apr 21 PHP

thinkPHP批量删除的实现方法分析

Nov 09 PHP

php常用字符函数实例小结

Dec 29 PHP

php使用ftp实现文件上传与下载功能

Jul 21 PHP

简单谈谈php浮点数精确运算

Mar 10 #PHP

PHP实现仿百度文库,豆丁在线文档效果(word,excel,ppt转flash)

Mar 10 #PHP

Zend Framework教程之Loader以及PluginLoader用法详解

Mar 09 #PHP

php注册登录系统简化版

Dec 28 #PHP

详解WordPress中用于更新和获取用户选项数据的PHP函数

Mar 08 #PHP

Zend Framework教程之Autoloading用法详解

Mar 08 #PHP

Zend Framework教程之Resource Autoloading用法实例

Mar 08 #PHP

You might like

开源php中文分词系统SCWS安装和使用实例

2014/04/11 PHP

php安装swoole扩展的方法

2015/03/19 PHP

浅谈PHP值mysql操作类

2016/06/29 PHP

php处理复杂xml数据示例

2016/07/11 PHP

PHP正则表达式匹配替换与分割功能实例浅析

2017/02/04 PHP

javascript 判断数组是否已包含了某个元素的函数

2010/05/30 Javascript

克隆javascript对象的三个方法小结

2011/01/12 Javascript

在多个页面使用同一个HTML片段的代码

2011/03/04 Javascript

一行命令搞定node.js 版本升级

2014/07/20 Javascript

jQuery实时显示鼠标指针位置和键盘ASCII码

2016/03/28 Javascript

浅析jQuery 3.0中的Data

2016/06/14 Javascript

Vue.js学习笔记之 helloworld

2016/08/14 Javascript

vue.js将unix时间戳转换为自定义时间格式

2017/01/03 Javascript

require.js与bootstrap结合实现简单的页面登录和页面跳转功能

2017/05/12 Javascript

Angular2.js实现表单验证详解

2017/06/23 Javascript

Angular项目中$scope.$apply()方法的使用详解

2017/07/26 Javascript

Angular CLI 使用教程指南参考小结

2019/04/10 Javascript

微信小程序实现带参数的分享功能(两种方法)

2019/05/17 Javascript

javascript实现扫雷简易版

2020/08/18 Javascript

python基础教程之常用运算符

2014/08/29 Python

python中zip()方法应用实例分析

2016/04/16 Python

numpy.random.seed()的使用实例解析

2018/02/03 Python

Python实现分段线性插值

2018/12/17 Python

python实现祝福弹窗效果

2019/04/07 Python

Django文件存储自己定制存储系统解析

2019/08/02 Python

Python学习笔记之列表和成员运算符及列表相关方法详解

2019/08/22 Python

pandas中遍历dataframe的每一个元素的实现

2019/10/23 Python

谈一谈数组拼接tf.concat()和np.concatenate()的区别

2020/02/07 Python

django配置app中的静态文件步骤

2020/03/27 Python

完美解决TensorFlow和Keras大数据量内存溢出的问题

2020/07/03 Python

html+js 实现markdown编辑器效果

2019/10/23 HTML / CSS

工厂车间标语

2014/06/19 职场文书

小学生通知书评语

2014/12/31 职场文书

求职自荐信该如何书写？

2019/06/24 职场文书

Ajax常用封装库——Axios的使用

2021/05/08 Javascript

Minikube搭建Kubernetes集群

2022/03/31 Servers