PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
php 常用字符串函数总结
Mar 15 PHP
php学习笔记 数组遍历实现代码
Jun 09 PHP
PHP中集成PayPal标准支付的实现方法分享
Feb 06 PHP
Php中使用Select 查询语句的实例
Feb 19 PHP
PHP fopen()和 file_get_contents()应用与差异介绍
Mar 19 PHP
ThinkPHP之R方法实例详解
Jun 20 PHP
php实现的太平洋时间和北京时间互转的自定义函数分享
Aug 19 PHP
php面象对象数据库操作类实例
Dec 02 PHP
Yii模型操作之criteria查找数据库的方法
Jul 15 PHP
深入解析PHP中SESSION反序列化机制
Mar 01 PHP
Yii实现复选框批量操作实例代码
Mar 15 PHP
Laravel关联模型中过滤结果为空的结果集(has和with区别)
Oct 18 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
php中如何同时使用session和cookie来保存用户登录信息
2013/07/05 PHP
php中数字0和空值的区别分析
2014/06/05 PHP
PHP使用in_array函数检查数组中是否存在某个值
2015/03/25 PHP
php实现将二维关联数组转换成字符串的方法详解
2017/07/31 PHP
PHP常量DIRECTORY_SEPARATOR原理及用法解析
2020/11/10 PHP
js 解决“options为空或不是对象”
2008/12/22 Javascript
javascript 有趣而诡异的数组
2009/04/06 Javascript
jQuery UI Autocomplete 1.8.16 中文输入修正代码
2012/04/16 Javascript
纯JS实现五子棋游戏兼容各浏览器(附源码)
2013/04/24 Javascript
解决jquery插件冲突的问题
2014/01/23 Javascript
用jquery等比例控制图片宽高的具体实现
2014/01/28 Javascript
javascript实现数字+字母验证码的简单实例
2014/02/10 Javascript
浅析tr的隐藏和显示问题
2014/03/05 Javascript
探讨:JavaScript ECAMScript5 新特性之get/set访问器
2016/05/05 Javascript
JS闭包、作用域链、垃圾回收、内存泄露相关知识小结
2016/05/16 Javascript
基于react框架使用的一些细节要点的思考
2017/05/31 Javascript
使用vue 国际化i18n 实现多实现语言切换功能
2018/10/11 Javascript
JS实现滑动插件
2020/01/15 Javascript
[50:48]LGD vs CHAOS 2019国际邀请赛小组赛 BO2 第二场 8.15
2019/08/16 DOTA
Python实现批量下载图片的方法
2015/07/08 Python
python绘制条形图方法代码详解
2017/12/19 Python
Python+selenium实现自动循环扔QQ邮箱漂流瓶
2018/05/29 Python
python实现合并两个排序的链表
2019/03/03 Python
python随机生成库faker库api实例详解
2019/11/28 Python
python 利用已有Ner模型进行数据清洗合并代码
2019/12/24 Python
PyQt5多线程防卡死和多窗口用法的实现
2020/09/15 Python
python中的测试框架
2020/11/13 Python
html5写一个BUI折叠菜单插件的实现方法
2019/09/11 HTML / CSS
美国东北部户外服装和设备零售商:Eastern Mountain Sports
2016/10/05 全球购物
传统软件工程与面向对象的软件工程有什么区别
2012/05/31 面试题
信息管理专业推荐信
2013/10/29 职场文书
小学捐书活动总结
2014/07/05 职场文书
农村优秀教师事迹材料
2014/08/27 职场文书
机关领导干部作风整顿整改措施
2014/09/19 职场文书
个人作风建设自查报告
2014/10/22 职场文书
2014年加油站工作总结
2014/12/04 职场文书