PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
用PHP编程语言开发动态WAP页面
Oct 09 PHP
用php来改写404错误页让你的页面更友好
Jan 24 PHP
php自动加载机制的深入分析
Jun 08 PHP
PHP APC的安装与使用详解
Jun 13 PHP
解析PHP提交后跳转
Jun 23 PHP
ThinkPHP连接数据库及主从数据库的设置教程
Aug 22 PHP
php中删除数组的第一个元素和最后一个元素的函数
Mar 07 PHP
php获取发送给用户的header信息的方法
Mar 16 PHP
php使用Image Magick将PDF文件转换为JPG文件的方法
Apr 01 PHP
WordPress中的shortcode短代码功能使用详解
May 17 PHP
php网页版聊天软件实现代码
Aug 12 PHP
php把时间戳转换成多少时间之前函数的实例
Nov 16 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
PHP自定义大小验证码的方法详解
2013/06/07 PHP
php实现字符串反转输出的方法
2015/03/14 PHP
PHP实现文件上传下载实例
2016/10/18 PHP
php  PATH_SEPARATOR判断当前服务器系统类型实例
2016/10/28 PHP
PHP 配置后台登录以及模板引入
2017/01/24 PHP
Yii2实现自定义独立验证器的方法
2017/05/05 PHP
PHP添加文字水印或图片水印的水印类完整源代码与使用示例
2019/03/18 PHP
JavaScript 定义function的三种方式小结
2009/10/16 Javascript
详解Javascript模板引擎mustache.js
2016/01/20 Javascript
AngularJS整合Springmvc、Spring、Mybatis搭建开发环境
2016/02/25 Javascript
AngularJS 中的指令实践开发指南(一)
2016/03/20 Javascript
JavaScript暂停和继续定时器的实现方法
2016/07/18 Javascript
vue.js初学入门教程(2)
2016/11/07 Javascript
清除输入框内的空格
2016/12/21 Javascript
详解利用 Express 托管静态文件的方法
2017/09/18 Javascript
jQuery实现参数自定义的文字跑马灯效果
2018/08/15 jQuery
微信小程序渲染性能调优小结
2019/07/30 Javascript
Vue插件之滑动验证码
2019/09/21 Javascript
[45:25]完美世界DOTA2联赛循环赛 PXG vs IO 第一场 11.06
2020/11/09 DOTA
python实现随机密码字典生成器示例
2014/04/09 Python
python多线程编程中的join函数使用心得
2014/09/02 Python
简述Python中的进程、线程、协程
2016/03/18 Python
python2.7 mayavi 安装图文教程(推荐)
2017/06/22 Python
python pandas实现excel转为html格式的方法
2018/10/23 Python
Django框架基础模板标签与filter使用方法详解
2019/07/23 Python
使用卷积神经网络(CNN)做人脸识别的示例代码
2020/03/27 Python
医疗保健专业人士购物网站:Scrubs & Beyond
2017/02/08 全球购物
纽约家具、家居装饰和地毯店:ABC Carpet & Home
2017/06/21 全球购物
文秘自荐信
2013/10/20 职场文书
环保口号大全
2014/06/12 职场文书
口才训练演讲稿范文
2014/09/16 职场文书
2014年政教处工作总结
2014/12/20 职场文书
优秀党支部申报材料
2014/12/24 职场文书
学习商务礼仪心得体会
2016/01/22 职场文书
聊一聊python常用的编程模块
2021/05/14 Python
进阶篇之linux环境下安装MySQL数据库
2022/04/09 MySQL