PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
php数组函数序列之prev() - 移动数组内部指针到上一个元素的位置,并返回该元素值
Oct 31 PHP
调试一段PHP程序时遇到的三个问题
Jan 17 PHP
PHP使用CURL_MULTI实现多线程采集的例子
Jul 29 PHP
初识php MVC
Sep 10 PHP
Yii框架中 find findAll 查找出制定的字段的方法对比
Sep 10 PHP
php实现汉字验证码和算式验证码的方法
Mar 07 PHP
php按字符无乱码截取中文的方法
Mar 27 PHP
简单谈谈php中的unicode和utf8编码
Jun 10 PHP
10个超级有用的PHP代码片段果断收藏
Sep 23 PHP
PHP中Closure类的使用方法及详解
Oct 09 PHP
PHP设计模式之适配器模式(Adapter)原理与用法详解
Dec 12 PHP
php操作redis数据库常见方法实例总结
Feb 20 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
php中将一段数据存到一个txt文件中并显示其内容
2014/08/15 PHP
mysql_connect localhost和127.0.0.1的区别(网络层阐述)
2015/03/26 PHP
10款实用的PHP开源工具
2015/10/23 PHP
PHP+Ajax 检测网络是否正常实例详解
2016/12/16 PHP
PHP实现基于栈的后缀表达式求值功能
2017/11/10 PHP
PHP实现的最大正向匹配算法示例
2017/12/19 PHP
jQuery position() 函数详解以及jQuery中position函数的应用
2015/12/14 Javascript
仿iframe效果Aajx文件上传实例
2016/11/18 Javascript
JS实现随机颜色的3种方法与颜色格式的转化
2017/01/05 Javascript
AngularJs ng-change事件/指令的用法小结
2017/11/01 Javascript
vue项目持久化存储数据的实现代码
2018/10/01 Javascript
如何为你的JavaScript代码日志着色详解
2019/04/08 Javascript
基于JavaScript实现留言板功能
2020/03/16 Javascript
Vue + Node.js + MongoDB图片上传组件实现图片预览和删除功能详解
2020/04/29 Javascript
JS如何寻找数组中心索引过程解析
2020/06/01 Javascript
0基础学习前端开发的一些建议
2020/07/14 Javascript
[38:32]DOTA2上海特级锦标赛A组资格赛#2 Secret VS EHOME第二局
2016/02/26 DOTA
Python实现二叉树结构与进行二叉树遍历的方法详解
2016/05/24 Python
详解Python中如何写控制台进度条的整理
2018/03/07 Python
python 中的命名空间,你真的了解吗?
2020/08/19 Python
五分钟带你搞懂python 迭代器与生成器
2020/08/30 Python
CSS3动画:5种预载动画效果实例
2017/04/05 HTML / CSS
全球知名提供各类营养保健品的零售商:Vitamin Shoppe
2016/10/09 全球购物
美国高端医师级美容产品电商:BeautifiedYou.com
2017/04/17 全球购物
Aeropostale官网:美国著名校园品牌及青少年服饰品牌
2019/03/21 全球购物
波兰电子产品购物网站:Vobis
2019/05/26 全球购物
欧缇丽加拿大官方网站:Caudalie加拿大
2019/07/18 全球购物
美国Curacao百货连锁店网站:iCuracao.com
2019/07/20 全球购物
GC是什么?为什么要有GC?
2013/12/08 面试题
档案室主任岗位职责
2014/02/12 职场文书
婚纱店策划方案
2014/05/22 职场文书
药品营销策划方案
2014/06/15 职场文书
六查六看心得体会
2014/10/14 职场文书
小学生通知书评语
2014/12/31 职场文书
交通事故调解协议书
2015/05/20 职场文书
2015年大学生暑期实习报告
2015/07/13 职场文书