PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
使用PHP编写的SVN类
Jul 18 PHP
PHP设置图片文件上传大小的具体实现方法
Oct 11 PHP
php实现加减法验证码代码
Feb 14 PHP
php去除数组中重复数据
Nov 18 PHP
CodeIgniter控制器之业务逻辑实例分析
Jan 20 PHP
Zend Framework基本页面布局分析
Mar 19 PHP
PHP的邮件群发系统phplist配置方法详细总结
Mar 30 PHP
PHP数组编码gbk与utf8互相转换的两种方法
Sep 01 PHP
PHP实现支持加盐的图片加密解密
Sep 09 PHP
thinkPHP中验证码的简单实现方法
Dec 05 PHP
针对thinkPHP5框架存储过程bug重写的存储过程扩展类完整实例
Jun 16 PHP
laravel框架上传图片实现实时预览功能
Oct 14 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
PHP 利用AJAX获取网页并输出的实现代码(Zjmainstay)
2012/08/31 PHP
hadoop中一些常用的命令介绍
2013/06/19 PHP
THinkPHP获取客户端IP与IP地址查询的方法
2016/11/14 PHP
php UNIX时间戳用法详解
2017/02/16 PHP
juqery 学习之四 筛选过滤
2010/11/30 Javascript
iphone safari不支持position fixed的解决方法
2012/05/04 Javascript
js日期、星座的级联显示代码
2014/01/23 Javascript
jQuery性能优化的38个建议
2014/03/04 Javascript
js解决select下拉选不中问题
2014/10/14 Javascript
jQuery仿淘宝网产品品牌隐藏与显示效果
2015/09/01 Javascript
每天一篇javascript学习小结(RegExp对象)
2015/11/17 Javascript
基于jQuery实现带动画效果超炫酷的弹出对话框(附源码下载)
2016/02/22 Javascript
使用BootStrap实现表格隔行变色及hover变色并在需要时出现滚动条
2017/01/04 Javascript
DOM事件探秘篇
2017/02/15 Javascript
node.js操作mongodb简单示例分享
2017/05/25 Javascript
Vue2.0基于vue-cli+webpack Vuex的用法(实例讲解)
2017/09/15 Javascript
简单了解vue中的v-if和v-show的区别
2019/10/08 Javascript
微信小程序实现时间戳格式转换
2020/07/20 Javascript
详解vue v-model
2020/08/31 Javascript
Python编写百度贴吧的简单爬虫
2015/04/02 Python
Django 实现下载文件功能的示例
2018/03/06 Python
对Python中plt的画图函数详解
2018/11/07 Python
使用python爬取抖音视频列表信息
2019/07/15 Python
在PyCharm的 Terminal(终端)切换Python版本的方法
2019/08/02 Python
django实现web接口 python3模拟Post请求方式
2019/11/19 Python
python使用opencv resize图像不进行插值的操作
2020/07/05 Python
CSS中越界问题的经典解决方案【推荐】
2016/04/19 HTML / CSS
移动端Web页面的CSS3 flex布局快速上手指南
2016/05/31 HTML / CSS
Html+Css+Jquery实现左侧滑动拉伸导航菜单栏的示例代码
2020/03/17 HTML / CSS
英国电子产品购物网站:TobyDeals
2018/07/30 全球购物
机械设计制造专业个人求职信
2013/09/25 职场文书
男方婚前保证书
2015/02/28 职场文书
left join、inner join、right join的区别
2021/04/05 MySQL
LayUI+Shiro实现动态菜单并记住菜单收展的示例
2021/05/06 Javascript
Django显示可视化图表的实践
2021/05/10 Python
JavaScript中reduce()的用法
2022/05/11 Javascript