PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
真正面向对象编程:PHP5.01发布
Oct 09 PHP
php 在文件指定行插入数据的代码
May 08 PHP
显示youtube视频缩略图和Vimeo视频缩略图代码分享
Feb 13 PHP
php中异常处理方法小结
Jan 09 PHP
基础的WordPress插件制作教程
Nov 24 PHP
学习php设计模式 php实现享元模式(flyweight)
Dec 07 PHP
详解WordPress中创建和添加过滤器的相关PHP函数
Dec 29 PHP
PHP二维数组排序简单实现方法
Feb 14 PHP
PHP面向对象程序设计高级特性详解(接口,继承,抽象类,析构,克隆等)
Dec 02 PHP
CI(CodeIgniter)框架实现图片上传的方法
Mar 24 PHP
PHP检查端口是否可以被绑定的方法示例
Aug 09 PHP
再谈Yii Framework框架中的事件event原理与应用
Apr 07 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
php中文字母数字验证码实现代码
2008/04/25 PHP
七款最流行的PHP本地服务器分享
2013/02/19 PHP
php截取字符串之截取utf8或gbk编码的中英文字符串示例
2014/03/12 PHP
PHP中nowdoc和heredoc使用需要注意的一点
2014/03/21 PHP
PHP异常Parse error: syntax error, unexpected T_VAR错误解决方法
2014/05/06 PHP
php中http与https跨域共享session的解决方法
2014/12/20 PHP
php str_replace替换指定次数的方法详解
2017/05/05 PHP
jQuery源码分析-03构造jQuery对象-工具函数
2011/11/14 Javascript
javascript工具库代码
2012/03/29 Javascript
js call方法详细介绍(js 的继承)
2013/11/18 Javascript
JavaScript中switch判断容易犯错的一个细节
2014/08/27 Javascript
JavaScript插件化开发教程 (三)
2015/01/27 Javascript
使用JQuery实现Ctrl+Enter提交表单的方法
2015/10/22 Javascript
JS判断字符串变量是否含有某个字串的实现方法
2016/06/03 Javascript
深入剖析JavaScript面向对象编程
2016/07/12 Javascript
JavaScript中for循环的几种写法与效率总结
2017/02/03 Javascript
基于vue2实现左滑删除功能
2017/11/28 Javascript
Vue.js+Layer表格数据绑定与实现更新的实例
2018/03/07 Javascript
JS实现从对象获取对象中单个键值的方法示例
2019/06/05 Javascript
使用jQuery实现掷骰子游戏
2019/10/24 jQuery
基于js判断浏览器是否支持webGL
2020/04/18 Javascript
Python中的下划线详解
2015/06/24 Python
全面了解Python的getattr(),setattr(),delattr(),hasattr()
2016/06/14 Python
Python实现基本数据结构中队列的操作方法示例
2017/12/04 Python
python验证码图片处理(二值化)
2019/11/01 Python
flask框架json数据的拿取和返回操作示例
2019/11/28 Python
Python如何实现后端自定义认证并实现多条件登陆
2020/06/22 Python
详解基于canvas的视频遮罩插件
2018/01/04 HTML / CSS
H5页面适配iPhoneX(就是那么简单)
2019/12/02 HTML / CSS
海蓝之谜英国官网:La Mer英国
2020/01/15 全球购物
美国沃尔玛网上超市:Walmart
2020/08/14 全球购物
小学生保护环境倡议书
2014/05/15 职场文书
城管个人总结
2015/02/28 职场文书
迎新晚会主持词开场白
2015/05/28 职场文书
《开国大典》教学反思
2016/02/16 职场文书
Springboot如何使用logback实现多环境配置?
2021/06/16 Java/Android