PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
PHP生成静态页面详解
Nov 19 PHP
PHP 配置文件中open_basedir选项作用
Jul 19 PHP
深入PHP异步执行的详解
Jun 03 PHP
深入PHP获取随机数字和字母的方法详解
Jun 06 PHP
更改localhost为其他名字的方法
Feb 10 PHP
ThinkPHP3.1新特性之动态设置自动完成及自动验证示例代码
Jun 23 PHP
php简单判断两个字符串是否相等的方法
Jul 13 PHP
yii2.0实现pathinfo的形式访问的配置方法
Apr 06 PHP
PHP随机数 C扩展随机数
May 04 PHP
CI框架支持$_GET的两种实现方法
May 18 PHP
golang与php实现计算两个经纬度之间距离的方法
Jul 22 PHP
php curl获取https页面内容,不直接输出返回结果的设置方法
Jan 15 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
PHP数据集构建JSON格式及新数组的方法
2012/11/07 PHP
php设计模式之单例、多例设计模式的应用分析
2013/06/30 PHP
Laravel中使用FormRequest进行表单验证方法及问题汇总
2016/06/19 PHP
php+jQuery+Ajax简单实现页面异步刷新
2016/08/08 PHP
基于Jquery的回车成tab焦点切换效果代码(Enter To Tab )
2010/11/14 Javascript
关于jQuery的inArray 方法介绍
2011/10/08 Javascript
前后台交互过程中json格式如何解析以及如何生成
2012/12/26 Javascript
javascript 获取网页标题代码实例
2014/01/22 Javascript
学习JavaScript设计模式(接口)
2015/11/26 Javascript
jQuery和JavaScript节点插入元素的方法对比
2016/11/18 Javascript
详谈JavaScript的闭包及应用
2017/01/17 Javascript
详解JS获取HTML DOM元素的8种方法
2017/06/17 Javascript
AngularJS解决ng-if中的ng-model值无效的问题
2017/06/21 Javascript
Vue 将后台传过来的带html字段的字符串转换为 HTML
2018/03/29 Javascript
深入理解Puppeteer的入门教程和实践
2019/03/05 Javascript
浅谈javascript中的prototype和__proto__的理解
2019/04/07 Javascript
layui 数据表格复选框实现单选功能的例子
2019/09/19 Javascript
python实现的文件同步服务器实例
2015/06/02 Python
python控制windows剪贴板,向剪贴板中写入图片的实例
2018/05/31 Python
Python线程之定位与销毁的实现
2019/02/17 Python
python3对拉勾数据进行可视化分析的方法详解
2019/04/03 Python
Appium+python自动化怎么查看程序所占端口号和IP
2019/06/14 Python
Python实现动态给类和对象添加属性和方法操作示例
2020/02/29 Python
python matplotlib包图像配色方案分享
2020/03/14 Python
Python如何使用bokeh包和geojson数据绘制地图
2020/03/21 Python
Pandas替换及部分替换(replace)实现流程详解
2020/10/12 Python
python基于win32api实现键盘输入
2020/12/09 Python
CSS3+JavaScript实现炫酷呼吸效果的示例代码
2020/06/15 HTML / CSS
受希腊女神灵感的晚礼服、鸡尾酒礼服和婚纱:THEIA
2018/04/15 全球购物
大整数数相乘的问题
2012/07/22 面试题
仓管员岗位职责范文
2013/11/08 职场文书
项目经理任命书
2014/06/04 职场文书
公司演讲稿开场白
2014/08/25 职场文书
家长会欢迎词
2015/01/23 职场文书
2019开业庆典剪彩仪式主持词!
2019/07/22 职场文书
Python利器openpyxl之操作excel表格
2021/04/17 Python