PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
用PHP实现维护文件代码
Jun 14 PHP
php实现单链表的实例代码
Mar 22 PHP
php中session过期时间设置及session回收机制介绍
May 05 PHP
ThinkPHP字符串函数及常用函数汇总
Jul 18 PHP
自定义session存储机制避免会话保持问题
Oct 08 PHP
PHP字符串word末字符实现大小写互换的方法
Nov 10 PHP
如何写php守护进程(Daemon)
Dec 30 PHP
php创建桌面快捷方式实现方法
Dec 31 PHP
浅谈PHP的反射机制
Dec 15 PHP
PHP使用 Imagick 扩展实现图片合成,圆角处理功能示例
Sep 09 PHP
Laravel5.5 视图 - 创建视图和数据传递示例
Oct 21 PHP
YII2框架中actions的作用与使用方法示例
Mar 13 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
咖啡因含量是由谁决定的?低因咖啡怎么来?低因咖啡适合什么人喝
2021/03/06 新手入门
PHP5中虚函数的实现方法分享
2011/04/20 PHP
php实现微信企业付款到个人零钱功能
2018/10/09 PHP
JavaScript 无符号右移赋值操作
2009/04/17 Javascript
IE和firefox浏览器的event事件兼容性汇总
2009/12/06 Javascript
JS俄罗斯方块,包含完整的设计理念
2010/12/11 Javascript
基于jquery的动态创建表格的插件
2011/04/05 Javascript
jquery获取radio值(单选组radio)
2014/10/16 Javascript
移动端触屏幻灯片图片切换插件idangerous swiper.js
2017/04/10 Javascript
js实现左右两侧浮动广告
2018/07/09 Javascript
浅谈js中的bind
2019/03/18 Javascript
详解基于mpvue微信小程序下载远程图片到本地解决思路
2019/05/16 Javascript
使用Vue+Django+Ant Design做一个留言评论模块的示例代码
2020/06/01 Javascript
教你安装python Django(图文)
2013/11/04 Python
在Python中使用异步Socket编程性能测试
2014/06/25 Python
Python读写unicode文件的方法
2015/07/10 Python
python实现按行切分文本文件的方法
2016/04/18 Python
使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法
2018/06/22 Python
设置python3为默认python的方法
2018/10/31 Python
Python os.access()用法实例
2019/02/18 Python
详解js文件通过python访问数据库方法
2019/03/03 Python
在python plt图表中文字大小调节的方法
2019/07/08 Python
python爬虫 猫眼电影和电影天堂数据csv和mysql存储过程解析
2019/09/05 Python
利用OpenCV和Python实现查找图片差异
2019/12/19 Python
python @propert装饰器使用方法原理解析
2019/12/25 Python
解决pyqt5异常退出无提示信息的问题
2020/04/08 Python
python代码中怎么换行
2020/06/17 Python
matplotlib制作雷达图报错ValueError的实现
2021/01/05 Python
HTML 5 标签、属性、事件及浏览器兼容性速查表 附打包下载
2012/10/20 HTML / CSS
ALDO加拿大官网:加拿大女鞋品牌
2018/12/22 全球购物
英国领先的豪华时尚家居网上商店:Amara
2019/08/12 全球购物
党员教师工作决心书
2014/03/13 职场文书
幼儿园中班上学期评语
2014/04/18 职场文书
倡议书的写法
2014/08/30 职场文书
《穷人》教学反思
2016/02/19 职场文书
基于PyTorch实现一个简单的CNN图像分类器
2021/05/29 Python