php iconv() : Detected an illegal character in input string


Posted in PHP onDecember 05, 2010

开始是这样用的
$str = iconv('UTF-8', 'GB2312', unescape(isset($_GET['str'])? $_GET['str']:''));
上线后报一堆这样的错:iconv() : Detected an illegal character in input string

考虑到GB2312字符集比较小,换个大的吧,于是改成GBK:
$str = iconv('UTF-8', 'GBK', unescape(isset($_GET['str'])? $_GET['str']:''));
上线后还是报同样的错!

再认真读手册,发现有这么一段:
If you append the string //TRANSLIT to out_charset transliteration is activated. This means that when a character can't be represented in the target charset, it can be approximated through one or several similarly looking characters. If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.
于是改成:
$str = iconv('UTF-8', 'GBK//IGNORE', unescape(isset($_GET['str'])? $_GET['str']:''));
本地测试//IGNORE能忽略掉它不认识的字接着往下转,并且不报错,而//TRANSLIT是截掉它不认识的字及其后面的内容,并且报错。//IGNORE是我需要的。
现在等待上线看结果(这样不是好的做法,继续琢磨手册,上网搜搜看),呵呵。。。

在网上找到下面这篇文章,发现mb_convert_encoding也可以,但效率比iconv差。

转换字符串编码iconv与mb_convert_encoding的区别

iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

string iconv ( string in_charset, string out_charset, string str )
注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:
1. 发现iconv在转换字符"-"到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个"-"都无法转换成功,无法输出。另外mb_convert_encoding没有这个bug.
2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;如:$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF- 8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异
3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.

$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', "auto");

例子:
$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");

PHP 相关文章推荐
第二节 对象模型 [2]
Oct 09 PHP
在PHP中执行系统外部命令
Oct 09 PHP
php strtotime 函数UNIX时间戳
Jan 14 PHP
基于php冒泡排序算法的深入理解
Jun 09 PHP
腾讯QQ微博API接口获取微博内容
Oct 30 PHP
php Calender(日历)代码分享
Jan 03 PHP
网站防止被刷票的一些思路与方法
Jan 08 PHP
浅谈PHP接收POST数据方式
Jun 05 PHP
ECshop 迁移到 PHP7版本时遇到的兼容性问题
Feb 15 PHP
PHP中FTP相关函数小结
Jul 15 PHP
laravel ORM 只开启created_at的几种方法总结
Jan 29 PHP
php中青蛙跳台阶的问题解决方法
Oct 14 PHP
php printf输出格式使用说明
Dec 05 #PHP
PHP执行zip与rar解压缩方法实现代码
Dec 05 #PHP
smarty模板嵌套之include与fetch性能测试
Dec 05 #PHP
php 学习资料零碎东西
Dec 04 #PHP
PHP访问MYSQL数据库封装类(附函数说明)
Dec 04 #PHP
PHP验证码类代码( 最新修改,完全定制化! )
Dec 02 #PHP
PHP项目开发中最常用的自定义函数整理
Dec 02 #PHP
You might like
PHP array 的加法操作代码
2010/07/24 PHP
PHP通过正则表达式下载图片到本地的实现代码
2011/09/19 PHP
PHP中3种生成XML文件方法的速度效率比较
2012/10/06 PHP
PHP-FPM之Chroot执行环境详解
2015/08/03 PHP
node.js中的fs.readFileSync方法使用说明
2014/12/15 Javascript
移动设备web开发首选框架:zeptojs介绍
2015/01/29 Javascript
分享五个有用的jquery小技巧
2015/10/08 Javascript
利用jQuery及AJAX技术定时更新GridView的某一列数据
2015/12/04 Javascript
Bootstrap基本样式学习笔记之表单(3)
2016/12/07 Javascript
Angularjs单选改为多选的开发过程及问题解析
2017/02/17 Javascript
Vue.Draggable实现拖拽效果
2020/07/29 Javascript
微信小程使用swiper组件实现图片轮播切换显示功能【附源码下载】
2017/12/12 Javascript
vue+iview+less+echarts实战项目总结
2018/02/22 Javascript
js实现一个简易计算器
2020/03/30 Javascript
Paypal支付不完全指北
2020/06/04 Javascript
支付宝小程序实现省市区三级联动
2020/06/21 Javascript
使用Vue-scroller页面input框不能触发滑动的问题及解决方法
2020/08/08 Javascript
vue 使用微信jssdk,调用微信相册上传图片功能
2020/11/13 Javascript
[01:27]DOTA2电竞之夜 今夜共饮庆功酒
2014/08/02 DOTA
[04:16]完美世界DOTA2联赛PWL S2 集锦第一期
2020/11/23 DOTA
最基础的Python的socket编程入门教程
2015/04/23 Python
Python中基本的日期时间处理的学习教程
2015/10/16 Python
分享6个隐藏的python功能
2017/12/07 Python
python 实现对文件夹内的文件排序编号
2018/04/12 Python
python文字转语音实现过程解析
2019/11/12 Python
使用Rasterio读取栅格数据的实例讲解
2019/11/26 Python
在python3中使用shuffle函数要注意的地方
2020/02/28 Python
html5手机端页面可以向右滑动导致样式受影响的问题
2018/06/20 HTML / CSS
Tea Collection官网:一家位于旧金山的童装公司
2020/08/07 全球购物
护士自我评价
2014/02/01 职场文书
演讲比赛获奖感言
2014/02/02 职场文书
资源工程专业毕业生求职信
2014/02/27 职场文书
优秀食品类广告词
2014/03/19 职场文书
民主评议党员自我鉴定
2014/10/21 职场文书
2015年人事专员工作总结
2015/04/29 职场文书
2016年庆“七一”主题党日活动总结
2016/04/05 职场文书