PHP编码转换函数 自动转换字符集支持数组转换


Posted in PHP onDecember 16, 2012
// 自动转换字符集 支持数组转换 
function auto_charset($fContents, $from='gbk', $to='utf-8') { 
$from = strtoupper($from) == 'UTF8' ? 'utf-8' : $from; 
$to = strtoupper($to) == 'UTF8' ? 'utf-8' : $to; 
if (strtoupper($from) === strtoupper($to) || empty($fContents) || (is_scalar($fContents) && !is_string($fContents))) { 
//如果编码相同或者非字符串标量则不转换 
return $fContents; 
} 
if (is_string($fContents)) { 
if (function_exists('mb_convert_encoding')) { 
return mb_convert_encoding($fContents, $to, $from); 
} elseif (function_exists('iconv')) { 
return iconv($from, $to, $fContents); 
} else { 
return $fContents; 
} 
} elseif (is_array($fContents)) { 
foreach ($fContents as $key => $val) { 
$_key = auto_charset($key, $from, $to); 
$fContents[$_key] = auto_charset($val, $from, $to); 
if ($key != $_key) 
unset($fContents[$key]); 
} 
return $fContents; 
} 
else { 
return $fContents; 
} 
}

当我们在接受未知客户端提交的数据,由于各客户端的编码不统一,但在我们的服务器端最终只能以一种编码方式来处理,这种情况下就会涉及到一个将接受到的字符转换为特定编码的问题。
这时可能会想到直接用iconv来进行转码,但我们知道,iconv这个函数需要提供的两个参数为输入编码和输出编码,而我们现在根本不知道接受的字符串是什么编码,如果这个时候能得到接收字符是什么编码就好了。
对于这样的问题,一般会有两种解决方案。

方案一
要客户端提交数据时,指定所提交的编码,这时就需要多给一个用来指定编码的变量。
$string = $_GET['charset'] === 'gbk' ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];
对于这种情况,如果在没有约定或者我们不能控制客户端的情况下,似乎这种方案使用不是很好。

方案二
直接由服务器端来检测所接收的数据编码。
这种方案当然是最理想了的了,现在问题是怎么检测一个字符的编码吗?对于这种情况,在php里,mb_string这个扩展中的mb_check_encoding提供了我们所需要的功能。
$str = mb_check_encoding($_GET['str'],'gbk') ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];
但这需要打开mb_string这个扩展,有些时候可能我们的生产服务器中没有打开这个扩展。对于这种情况,需要自己借助如下函数来判断编码。
以下函数非本人所写

function isGb2312($string) { 
for($i=0; $i 127) { 
if( ($v >= 228) && ($v < = 233) ) 
{ 
if( ($i+2) >= (strlen($string) - 1)) return true; 
$v1 = ord( $string[$i+1] ); 
$v2 = ord( $string[$i+2] ); 
if( ($v1 >= 128) && ($v1 < =191) && ($v2 >=128) && ($v2 < = 191) ) 
return false; 
else 
return true; 
} 
} 
} 
return true; 
} 
function isUtf8($string) { 
return preg_match('%^(?: 
[\x09\x0A\x0D\x20-\x7E] # ASCII 
| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte 
| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs 
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte 
| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates 
| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3 
| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15 
| \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16 
)*$%xs', $string); 
}

这里我们就可以使以上任何一个函数来实现编码的检测。并将其转换成指定的编码。
$str = isGb2312($_GET['str'],'gbk') ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];
PHP 相关文章推荐
php $_ENV为空的原因分析
Jun 01 PHP
PHPLog php 程序调试追踪工具
Sep 09 PHP
php获取远程图片的两种 CURL方式和sockets方式获取远程图片
Nov 07 PHP
linux命令之调试工具strace的深入分析
Jun 03 PHP
php定时计划任务与fsockopen持续进程实例
May 23 PHP
PHP实现抓取HTTPS内容
Dec 01 PHP
浅谈json_encode用法
Mar 05 PHP
php mysql_list_dbs()函数用法示例
Mar 29 PHP
PHP实现正则匹配所有括号中的内容
Jun 22 PHP
php简单计算权重的方法示例【适合抽奖类应用】
Jun 10 PHP
详解Laravel设置多态关系模型别名的方式
Oct 17 PHP
解决thinkphp6(tp6)在状态码500下不报错,或者显示错误“Malformed UTF-8 characters”的问题
Apr 01 PHP
PHP获取http请求的头信息实现步骤
Dec 16 #PHP
php获取通过http协议post提交过来xml数据及解析xml
Dec 16 #PHP
mysql 查询指定日期时间内sql语句实现原理与代码
Dec 16 #PHP
非常精妙的PHP递归调用与静态变量使用
Dec 16 #PHP
PHP--用万网的接口实现域名查询功能
Dec 13 #PHP
phpexcel导出excel的颜色和网页中的颜色显示不一致
Dec 11 #PHP
PHP5.3的垃圾回收机制(动态存储分配方案)深入理解
Dec 10 #PHP
You might like
Terran剧情介绍
2020/03/14 星际争霸
php数组函数序列之array_sum() - 计算数组元素值之和
2011/10/29 PHP
thinkPHP下ueditor的使用方法详解
2015/12/26 PHP
php框架CI(codeigniter)自动加载与自主创建对象操作实例分析
2020/06/06 PHP
CSS心形加载的动画源码的实现
2021/03/09 HTML / CSS
Aptana调试javascript图解教程
2009/11/30 Javascript
javascript 循环读取JSON数据的代码
2010/07/17 Javascript
javascript实时获取鼠标坐标值并显示的方法
2015/04/30 Javascript
Javascript简单实现面向对象编程继承实例代码
2015/11/27 Javascript
微信小程序之ES6与事项助手的功能实现
2016/11/30 Javascript
Vuex之理解Store的用法
2017/04/19 Javascript
解决layUI的页面显示不全的问题
2019/09/20 Javascript
JavaScript实现简易计算器小功能
2020/10/22 Javascript
[56:18]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#2 MVP.Phx VS Fnatic第二局
2016/03/05 DOTA
[01:10]DOTA2 Supermajor:英雄,由我们见证
2018/05/14 DOTA
Python THREADING模块中的JOIN()方法深入理解
2015/02/18 Python
Python实现登录人人网并抓取新鲜事的方法
2015/05/11 Python
CentOS6.5设置Django开发环境
2016/10/13 Python
Python编程实现二叉树及七种遍历方法详解
2017/06/02 Python
详解python里使用正则表达式的分组命名方式
2017/10/24 Python
Python实现的井字棋(Tic Tac Toe)游戏示例
2018/01/31 Python
Python openpyxl 遍历所有sheet 查找特定字符串的方法
2018/12/10 Python
OpenCV Python实现拼图小游戏
2020/03/23 Python
pytorch SENet实现案例
2020/06/24 Python
Keras中 ImageDataGenerator函数的参数用法
2020/07/03 Python
小区门卫岗位职责
2013/12/31 职场文书
2014领导班子正风肃纪思想汇报
2014/09/18 职场文书
2014大学生党员评议个人总结
2014/09/22 职场文书
上课玩手机的检讨书
2014/10/01 职场文书
工程部部长岗位职责
2015/02/12 职场文书
2019辞职报告范本3篇!
2019/07/23 职场文书
Python控制台输出俄罗斯方块移动和旋转功能
2021/04/18 Python
用Python爬取各大高校并可视化帮弟弟选大学,弟弟直呼牛X
2021/06/11 Python
CSS实现九宫格布局(自适应)的示例代码
2022/02/12 HTML / CSS
Python中第三方库Faker的使用详解
2022/04/02 Python
python和anaconda的区别
2022/05/06 Python