PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
php 获取一个月第一天与最后一天的代码
May 16 PHP
PHP开发框架Laravel数据库操作方法总结
Sep 03 PHP
PHP获取当前所在目录位置的方法
Nov 26 PHP
Yii使用ajax验证显示错误messagebox的解决方法
Dec 03 PHP
基于PHP代码实现中奖概率算法可用于刮刮卡、大转盘等抽奖算法
Dec 20 PHP
twig里使用js变量的方法
Feb 05 PHP
Yii2超好用的日期和时间组件(值得收藏)
May 05 PHP
PHP 在数组中搜索给定的简单实例 array_search 函数
Jun 13 PHP
php获取POST数据的三种方法实例详解
Dec 20 PHP
php实现不通过扩展名准确判断文件类型的方法【finfo_file方法与二进制流】
Apr 18 PHP
php删除一个路径下的所有文件夹和文件的方法
Feb 07 PHP
discuz论坛更换域名,详细文件修改步骤
Dec 09 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
PHP 和 XML: 使用expat函数(三)
2006/10/09 PHP
php的curl封装类用法实例
2014/11/07 PHP
PHP常用处理静态操作类
2015/04/03 PHP
PHP抽奖算法程序代码分享
2015/10/08 PHP
php实现的pdo公共类定义与用法示例
2017/07/19 PHP
JS类的封装及实现代码
2009/12/02 Javascript
JS函数验证总结(方便js客户端输入验证)
2010/10/29 Javascript
Safari5中alert的无限循环BUG
2011/04/07 Javascript
常见效果实现之返回顶部(结合淡入、淡出、减速滚动)
2012/01/04 Javascript
jQuery结合AJAX之在页面滚动时从服务器加载数据
2015/06/30 Javascript
基于jQuery实现仿QQ空间送礼物功能代码
2016/05/24 Javascript
JavaScript动态添加事件之事件委托
2016/07/12 Javascript
canvas的神奇用法
2017/02/03 Javascript
使用原生的javascript来实现轮播图
2017/02/24 Javascript
jQuery实现的上传图片本地预览效果简单示例
2018/03/29 jQuery
jQuery滑动效果实现方法分析
2018/09/05 jQuery
解决vue无法设置滚动位置的问题
2018/10/07 Javascript
在vue+element ui框架里实现lodash的debounce防抖
2019/11/13 Javascript
Ant Design Vue table中列超长显示...并加提示语的实例
2020/10/31 Javascript
[48:23]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#1COL VS EG第一局
2016/03/05 DOTA
[01:02:54]完美世界DOTA2联赛PWL S2 FTD vs GXR 第一场 11.22
2020/11/26 DOTA
itchat和matplotlib的结合使用爬取微信信息的实例
2017/08/25 Python
Python中的浮点数原理与运算分析
2017/10/12 Python
python机器人运动范围问题的解答
2019/04/29 Python
python获取响应某个字段值的3种实现方法
2020/04/30 Python
QML用PathView实现轮播图
2020/06/03 Python
Python API 操作Hadoop hdfs详解
2020/06/06 Python
css3的动画特效之动画序列(animation)
2017/12/22 HTML / CSS
澳大利亚制造的羊皮靴:Original UGG Boots
2017/11/13 全球购物
乌克兰最大的家用电器和电子产品连锁店:Eldorado
2019/10/02 全球购物
如何找出EMP表里面SALARY第N高的employee
2013/12/05 面试题
村级换届选举方案
2014/05/10 职场文书
2015年团支部年度工作总结
2015/05/27 职场文书
小学总务工作总结
2015/08/13 职场文书
推普标语口号大全
2015/12/26 职场文书
十个Python自动化常用操作,即拿即用
2021/05/10 Python