php iconv() : Detected an illegal character in input string


Posted in PHP onDecember 05, 2010

开始是这样用的
$str = iconv('UTF-8', 'GB2312', unescape(isset($_GET['str'])? $_GET['str']:''));
上线后报一堆这样的错:iconv() : Detected an illegal character in input string

考虑到GB2312字符集比较小,换个大的吧,于是改成GBK:
$str = iconv('UTF-8', 'GBK', unescape(isset($_GET['str'])? $_GET['str']:''));
上线后还是报同样的错!

再认真读手册,发现有这么一段:
If you append the string //TRANSLIT to out_charset transliteration is activated. This means that when a character can't be represented in the target charset, it can be approximated through one or several similarly looking characters. If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.
于是改成:
$str = iconv('UTF-8', 'GBK//IGNORE', unescape(isset($_GET['str'])? $_GET['str']:''));
本地测试//IGNORE能忽略掉它不认识的字接着往下转,并且不报错,而//TRANSLIT是截掉它不认识的字及其后面的内容,并且报错。//IGNORE是我需要的。
现在等待上线看结果(这样不是好的做法,继续琢磨手册,上网搜搜看),呵呵。。。

在网上找到下面这篇文章,发现mb_convert_encoding也可以,但效率比iconv差。

转换字符串编码iconv与mb_convert_encoding的区别

iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

string iconv ( string in_charset, string out_charset, string str )
注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:
1. 发现iconv在转换字符"-"到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个"-"都无法转换成功,无法输出。另外mb_convert_encoding没有这个bug.
2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;如:$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF- 8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异
3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.

$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', "auto");

例子:
$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");

PHP 相关文章推荐
PHP 和 MySQL 基础教程(一)
Oct 09 PHP
php实现的在线人员函数库
Apr 09 PHP
PHP 设置MySQL连接字符集的方法
Jan 02 PHP
PHP文件上传判断file是否己选择上传文件的方法
Nov 10 PHP
PHP实现链式操作的原理详解
Sep 16 PHP
php实现的简单中文验证码功能示例
Jan 03 PHP
在php7中MongoDB实现模糊查询的方法详解
May 03 PHP
OAuth认证协议中的HMACSHA1加密算法(实例)
Oct 25 PHP
Laravel框架生命周期与原理分析
Jun 12 PHP
PHP使用HTML5 FileApi实现Ajax上传文件功能示例
Jul 01 PHP
laravel接管Dingo-api和默认的错误处理方式
Oct 25 PHP
PHP7 list() 函数修改
Mar 09 PHP
php printf输出格式使用说明
Dec 05 #PHP
PHP执行zip与rar解压缩方法实现代码
Dec 05 #PHP
smarty模板嵌套之include与fetch性能测试
Dec 05 #PHP
php 学习资料零碎东西
Dec 04 #PHP
PHP访问MYSQL数据库封装类(附函数说明)
Dec 04 #PHP
PHP验证码类代码( 最新修改,完全定制化! )
Dec 02 #PHP
PHP项目开发中最常用的自定义函数整理
Dec 02 #PHP
You might like
加速XP搜索功能堪比vista
2007/03/22 PHP
基于在生产环境中使用php性能测试工具xhprof的详解
2013/06/03 PHP
作为程序员必知的16个最佳PHP库
2015/12/09 PHP
Zend Framework教程之Bootstrap类用法概述
2016/03/14 PHP
PHP查看SSL证书信息的方法
2016/09/22 PHP
通过JAVASCRIPT读取ASP设定的COOKIE
2006/11/24 Javascript
ExtJS 学习专题(一) 如何应用ExtJS(附实例)
2010/03/11 Javascript
jquery点击页面任何区域实现鼠标焦点十字效果
2013/06/21 Javascript
js中indexof的用法详细解析
2013/12/24 Javascript
JS函数this的用法实例分析
2015/02/05 Javascript
jQuery实现点击后标记当前菜单位置(背景高亮菜单)效果
2015/08/22 Javascript
vue实现表格增删改查效果的实例代码
2017/07/18 Javascript
EasyUI的DataGrid每行数据添加操作按钮的实现代码
2017/08/22 Javascript
原生JS与jQuery编写简单选项卡
2017/10/30 jQuery
nodejs操作mongodb的填删改查模块的制作及引入实例
2018/01/02 NodeJs
微信小程序实现留言板(Storage)
2018/11/02 Javascript
如何使用JavaScript检测空闲的浏览器选项卡
2020/05/28 Javascript
Vue表单提交点击事件只允许点击一次的实例
2020/10/23 Javascript
[59:08]DOTA2上海特级锦标赛C组小组赛#2 LGD VS Newbee第一局
2016/02/27 DOTA
使用graphics.py实现2048小游戏
2015/03/10 Python
python使用itchat实现手机控制电脑
2018/02/22 Python
python实现求解列表中元素的排列和组合问题
2018/03/15 Python
python如何实现内容写在图片上
2018/03/23 Python
详解从Django Rest Framework响应中删除空字段
2019/01/11 Python
python安装gdal的两种方法
2019/10/29 Python
python将字符串转变成dict格式的实现
2019/11/18 Python
解决Python二维数组赋值问题
2019/11/28 Python
python deque模块简单使用代码实例
2020/03/12 Python
解决Django响应JsonResponse返回json格式数据报错问题
2020/08/09 Python
英国第一的市场和亚马逊替代品:OnBuy
2019/03/16 全球购物
超市优秀员工获奖感言
2014/08/15 职场文书
四风问题个人对照检查剖析材料
2014/09/27 职场文书
加强作风建设演讲稿
2014/10/24 职场文书
个人年度总结报告
2015/03/09 职场文书
python字典的元素访问实例详解
2021/07/21 Python
MongoDB修改oplog大小的四种方法
2022/04/11 MongoDB