PHP也能干大事之PHP中的编码解码详解


Posted in PHP onApril 20, 2015

写在前面

PHP也能干大事是我总结的PHP语法特性及相关函数类库的经典用法,并不一定是真正能实现四两拨千斤的功效,但是掌握这些方法,可以在你的工作和学习上有一些帮助,希望大家能集思广益,将《PHP也能干大事》丰富得更精彩!转载请注明出处(3water.com)

二、前言

PHP是常见的脚本语言,主要是因为其简单易学,上手快,几乎50%以上的Web程序都有PHP的身影(不完全统计)。PHP为开发这提供了丰富的函数和API接口,这使得我们能够非常方便地使用其强大的内置函数及扩展,本文是《PHP也能干大事》系列的第一篇,主要总结PHP在编解码、进制转换方面的知识。

PHP也能干大事之PHP中的编码解码详解

三、PHP编解码

1、ASCII编解码

ASCII(发音:英语发音:/ˈæski/ ASS-kee,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本EASCII则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。由于万维网使得ASCII广为通用,直到2007年12月,逐渐被Unicode取代。 https://zh.wikipedia.org/zh/ASCII

PHP也能干大事之PHP中的编码解码详解

PHP基本函数内置了ASCII的编解码函数,这使得我们能轻松进行ASCII编解码。

int ord ( string $string ) //返回字符串 string 第一个字符的 ASCII 码值。
string chr ( int $ascii  ) //返回相对应于 ascii 所指定的单个字符。

<?php

$str = 'Welcome to China';

function getNum($string){

    $needle = 0;

    $num = '';

    while (isset($string[$needle])) {

        $num .= $num==0?'':' ';

        $num .= ord($string[$needle]);

        $needle++;

    }

    return $num;

}

function getChar($num){

    $num_arr = explode(' ', $num);

    $string = '';

    foreach ($num_arr as $value) {

        $string .= chr($value);

    }

    return $string;

}

echo "字符转ASCII码\n";

echo getNum($str);

echo "\n";

echo "ASCII码字符\n";

echo getChar(getNum($str));

/* @OUTPUT

字符转ASCII码

87 101 108 99 111 109 101 32 116 111 32 67 104 105 110 97

ASCII码字符

Welcome to China

*/

 

?>

2、URL编解码

URL编码是一种浏览器用来打包表单输入的格式。浏览器从表单中获取所有的name和其中的值,将它们以name/value参数编码作为URL的一部分或者分离地发给服务器。比如我们在访问网页中,会出现很多带有%的字符串,这就是URL编码。

URL编码一般采用UTF-8编码格式,所以建议采用UTF-8格式传递数据。正常意义的URL编码可以理解为ASCII码的16进制前加上%,无大小写区分。

string urlencode(string $str)  //此函数便于将字符串编码并将其用于URL的请求部分,同时它还便于将变量传递给下一页。空格编码成 + 。

string urldecode(string $str)  //解码给出的已编码字符串中的任何 %XX,加号('+')被解码成一个空格字符。

string rawurlencode (string $str)   //根据 RFC 3986 编码指定的字符,空格转换成%20。

string rawurldecode (string $str)   //返回字符串,此字符串中百分号(%)后跟两位十六进制数的序列都将被替换成原义字符。 + 不被转换成空格。

两组函数用法一样,除了对于+和空格的转换处理上:rawurlencode将空格转为%20,不将+转为空格;urlencode则不一样。

<?php

$str_arr = array(

    '3water.com',

    'https://3water.com/',

    'PHP也能干大事',

    '!@#$%^&*()_+=-~`[]{}|\\;:\'"<>,./?'

    );

foreach ($str_arr as $key => $value) {

    echo $value,"\t->\t",urlencode($value),"\n";

}

/* @OUTPUT
3water.com  ->    3water.com
https://3water.com/  ->    http%3A%2F%2F3water.com%2F

PHP也能干大事  ->    PHP%E4%B9%9F%E8%83%BD%E5%B9%B2%E5%A4%A7%E4%BA%8B
!@#$%^&*()_+=-~`[]{}|\;:'"<>,./?      ->    %21%40%23%24%25%5E%26%2A%28%29_%2B%3D-%7E%60%5B%5D%7B%7D%7C%5C%3B%3A%27%22%3C%3E%2C.%2F%3F

*/

?>

3、Base64编解码

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2的6次方等于64,所以每6个位元为一个单元,对应某个可打印字符。三个字节有24个位元,对应于4个Base64单元,即3个字节需要用4个可打印字符来表示。它可用来作为电子邮件的传输编码。使用的字符包括大小写字母各26个,加上10个数字,和加号「+」,斜杠「/」,一共64个字符,等号「=」用来作为后缀用途。完整的base64定义可见RFC 1421和RFC 2045。编码后的数据比原始数据略长,为原来的4/3。在电子邮件中,根据RFC 822规定,每76个字符,还需要加上一个回车换行。可以估算编码后数据长度大约为原长的135.1%。 https://zh.wikipedia.org/zh/Base64

string base64_encode(string $data)  //使用 base64 对 data 进行编码。
string base64_decode (string $data [, bool $strict = false ])  //对 base64 编码的 data 进行解码。

案例:HTML页面中img标签可以在src属性中采用base64编码方式,来输出图片,这样可以减少HTTP请求次数。

<?php

$string = file_get_content('3mc2.png');

echo '<img src="data:image/png;base64,',base64_encode($string),'">';

/* @OUTPUT

UEhQ5Lmf6IO95Yqe5aSn5LqL

*/

?>

4、HTML实体编解码

一些字符在HTML中是预留的,拥有特殊的含义,比如小于号「<」用于定义HTML标签的开始。如果我们希望浏览器正确地显示这些字符,我们必须在 HTML 源码中插入字符实体。字符实体有三部分:一个和号「&」 和一个实体名称(或者一个 「#」 和一个实体编号),以及一个分号「;」。http://www.ascii.cl/htmlcodes.htm

string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = “UTF-8″ [, bool $double_encode = true ]]] )  //对包含如下HTML特殊字符进行HTML实体编码
1.'&' (ampersand) becomes ‘&'
2.'”‘ (double quote) becomes ‘"' when ENT_NOQUOTES is not set.
3.”‘” (single quote) becomes ‘'' (or ') only when ENT_QUOTES is set.
4.'<‘ (less than) becomes ‘<'
5.'>' (greater than) becomes ‘>'

string htmlspecialchars_decode (string $string [, int $flags = ENT_COMPAT | ENT_HTML401 ])  //此函数的作用和 htmlspecialchars() 刚好相反。它将特殊的HTML实体转换回普通字符。
还有功能相同的函数htmlentities/html_entity_decode,这对函数甚至对汉字都进行了HTML实体编码,而且会产生乱码,所以建议使用htmlspecialchars进行编解码。

案例:防止XSS跨站脚本攻击,需要对用户提交的数据进行HTML实体转换:

<?php

$_POST['message'] = '测试留言字符\'"><sCript src=https://3water.com/hook.js>';

if (empty($_POST['message'])) {

    exit('Message is NULL');

}

$message = htmlspecialchars(trim($_POST['message']));

echo $message;

/* @OUTPUT

测试留言字符'"><sCript src=https://3water.com/hook.js>

*/

?>

5、二进制、八进制、十进制、十六进制相互转换

进制之间的转换这里没什么好说的,总之都差不多,只要记住多少进制就是逢多少进一位,比如10进制就是9的下一位就是10,二进制、八进制、十六进制以此类推。

string bin2hex (string $str) //返回 ASCII 字符串,为参数 str 的十六进制表示。转换使用字节方式,高四位字节优先。
string hex2bin (string $data) //转换十六进制字符串为二进制字符串。
number bindec (string $binary_string) //返回 binary_string 参数所表示的二进制数的十进制等价值。
string decbin (int $number) //返回一字符串,包含有给定 number 参数的二进制表示。所能转换的最大数值为十进制的 4294967295,其结果为 32 个 1 的字符串。
number octdec (string $octal_string) //返回 octal_string 参数所表示的八进制数的十进制等值。
string decoct (int $number) //返回一字符串,包含有给定 number 参数的八进制表示。所能转换的最大数值为十进制的 4294967295,其结果为 “37777777777”。
string base_convert (string $number , int $frombase , int $tobase) //任意进制转换,返回一字符串,包含 number 以 tobase 进制的表示。number 本身的进制由 frombase 指定。frombase 和 tobase 都只能在 2 和 36 之间(包括 2 和 36)。高于十进制的数字用字母 a-z 表示,例如 a 表示 10,b 表示 11 以及 z 表示 35。

6 、GBK、UTF-8字符编码转换

在写代码过程中,经常遇到编码问题而引发的乱码。其实解决编码问题非常简单,只要使用一种编码即可,一般来说,采用万国码——UTF-8是最好的选择。

这里说的编码是文字编码和文件存储的编码,当然,不得不提到系统的编码的差异性:

系统             编码     字符结尾
Windows    GBK     \r\n
*nix             UTF-8   \n

所以在处理特殊字符的时候要特别注意。

常见的编码有GBK、UTF-8等等,函数使用上一般采用两种:

string mb_convert_encoding (string $str , string $to_encoding [, mixed $from_encoding = mb_internal_encoding() ])  //将 string 类型 str 的字符编码从可选的 from_encoding 转换到 to_encoding。
string iconv (string $in_charset , string $out_charset , string $str)  //将字符串 str 从 in_charset 转换编码到 out_charset。

案例:Windows系统,架设了一个WAMP服务器,将如下脚本另存为一个UTF-8编码的php文件,即可通过浏览器查看无乱码的php目录里的文件;如果不是用mb_convert_encoding转码,将直接导致输出乱码(Windows作为服务器)。

<?php 

    function getDir($dir){

        static $string = '';

        if(is_file($dir)){

            $string.= $dir;

        }else{

            $oDir = @opendir($dir);

            while($fileName = readdir($oDir)){

                if($fileName!='.' && $fileName!='..'){

                    if(is_file($dir.'/'.$fileName)){

                        $string.=$fileName."\n";

                    }elseif(is_dir($dir.'/'.$fileName)){

                        $string.= $dir.'/'.$fileName.'/'."\n";

                        getDir($dir.'/'.$fileName);

                    }

                }

            }

        }

        return $string;

    }

    echo mb_convert_encoding( getDir('php'),'utf8', 'gbk' );

 

?>

四、总结

编码是数据的处理的基础,所以在PHP的编程开发过程中是相当重要的。对于PHP的处理方法,应用在编程中还需要数量掌握,特别有些相似函数要如何区分。转载请注明出处(3water.com)

PHP 相关文章推荐
Memcache 在PHP中的使用技巧
Feb 08 PHP
php下使用SimpleXML 处理XML 文件
Feb 27 PHP
php下将图片以二进制存入mysql数据库中并显示的实现代码
May 27 PHP
PHP下通过exec获得计算机的唯一标识[CPU,网卡 MAC地址]
Jun 09 PHP
php源码分析之DZX1.5字符串截断函数cutstr用法
Jun 17 PHP
php提交过来的数据生成为txt文件
Apr 28 PHP
PHP MySql增删改查的简单实例
Jun 21 PHP
php解析xml 的四种简单方法(附实例)
Jul 11 PHP
php无限级分类实现方法分析
Oct 19 PHP
PHP删除数组中指定值的元素常用方法实例分析【4种方法】
Aug 21 PHP
php使用gearman进行任务分发操作实例详解
Feb 26 PHP
php修改word的实例方法
Nov 17 PHP
php中使用base HTTP验证的方法
Apr 20 #PHP
PHP加密解密类实例分析
Apr 20 #PHP
php通过分类列表产生分类树数组的方法
Apr 20 #PHP
PHP统计数值数组中出现频率最多的10个数字的方法
Apr 20 #PHP
PHP查找数值数组中不重复最大和最小的10个数的方法
Apr 20 #PHP
php获取本周星期一具体日期的方法
Apr 20 #PHP
php实现猴子选大王问题算法实例
Apr 20 #PHP
You might like
针对初学PHP者的疑难问答(2)
2006/10/09 PHP
解析smarty 截取字符串函数 truncate的用法介绍
2013/06/20 PHP
如何判断php mysqli扩展类是否开启
2016/12/24 PHP
PHP实现中国公民身份证号码有效性验证示例代码
2017/05/03 PHP
自制PHP框架之路由与控制器
2017/05/07 PHP
PHP正则删除HTML代码中宽高样式的方法
2017/06/12 PHP
Yii2语言国际化自动配置详解
2018/08/22 PHP
PHP+Apache实现二级域名之间共享cookie的方法
2019/07/24 PHP
window.parent调用父框架时 ie跟火狐不兼容问题
2009/07/30 Javascript
纯JavaScript实现的完美渐变弹出层效果代码
2010/04/02 Javascript
jQuery帮助之筛选查找 children([expr])
2011/01/31 Javascript
浅析JavaScript回调函数应用
2016/05/22 Javascript
jQuery短信验证倒计时功能实现方法详解
2016/05/25 Javascript
javascript特殊文本输入框网页特效
2016/09/13 Javascript
JS实现的点击表头排序功能示例
2017/03/27 Javascript
使用Angular CLI从蓝本生成代码详解
2018/03/24 Javascript
JS实现的哈夫曼编码示例【原始版与修改版】
2018/04/22 Javascript
微信小程序实现手指触摸画板
2018/07/09 Javascript
vue实现自定义日期组件功能的实例代码
2018/11/06 Javascript
微信小程序可滑动周日历组件使用详解
2019/10/21 Javascript
详解为element-ui的Select和Cascader添加弹层底部操作按钮
2020/02/07 Javascript
Vue+Element ui 根据后台返回数据设置动态表头操作
2020/09/21 Javascript
Python数据结构之翻转链表
2017/02/25 Python
Python实现的排列组合计算操作示例
2017/10/13 Python
python使用正则表达式的search()函数实现指定位置搜索功能
2017/11/10 Python
python频繁写入文件时提速的方法
2019/06/26 Python
pytorch numpy list类型之间的相互转换实例
2019/08/18 Python
python动态文本进度条的实例代码
2020/01/22 Python
关于Tensorflow使用CPU报错的解决方式
2020/02/05 Python
python按顺序重命名文件并分类转移到各个文件夹中的实现代码
2020/07/21 Python
纯CSS3制作漂亮带动画效果的主机价格表
2015/04/25 HTML / CSS
欧缇丽加拿大官方网站:Caudalie加拿大
2019/07/18 全球购物
2014年综治维稳工作总结
2014/11/17 职场文书
让世界充满爱观后感
2015/06/10 职场文书
网吧管理制度范本
2015/08/05 职场文书
大学文艺委员竞选稿
2015/11/19 职场文书