php iconv() : Detected an illegal character in input string


Posted in PHP onDecember 05, 2010

开始是这样用的
$str = iconv('UTF-8', 'GB2312', unescape(isset($_GET['str'])? $_GET['str']:''));
上线后报一堆这样的错:iconv() : Detected an illegal character in input string

考虑到GB2312字符集比较小,换个大的吧,于是改成GBK:
$str = iconv('UTF-8', 'GBK', unescape(isset($_GET['str'])? $_GET['str']:''));
上线后还是报同样的错!

再认真读手册,发现有这么一段:
If you append the string //TRANSLIT to out_charset transliteration is activated. This means that when a character can't be represented in the target charset, it can be approximated through one or several similarly looking characters. If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.
于是改成:
$str = iconv('UTF-8', 'GBK//IGNORE', unescape(isset($_GET['str'])? $_GET['str']:''));
本地测试//IGNORE能忽略掉它不认识的字接着往下转,并且不报错,而//TRANSLIT是截掉它不认识的字及其后面的内容,并且报错。//IGNORE是我需要的。
现在等待上线看结果(这样不是好的做法,继续琢磨手册,上网搜搜看),呵呵。。。

在网上找到下面这篇文章,发现mb_convert_encoding也可以,但效率比iconv差。

转换字符串编码iconv与mb_convert_encoding的区别

iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先启用 mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

string iconv ( string in_charset, string out_charset, string str )
注意:
第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,
其中:
//TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,
//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:
1. 发现iconv在转换字符"-"到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个"-"都无法转换成功,无法输出。另外mb_convert_encoding没有这个bug.
2. mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;如:$str = mb_convert_encoding($str,"euc-jp","ASCII,JIS,EUC-JP,SJIS,UTF- 8");“ASCII,JIS,EUC-JP,SJIS,UTF-8”的顺序不同效果也有差异
3. 一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.

$str = mb_convert_encoding($str, "UCS-2LE", "JIS, eucjp-win, sjis-win");
$str = mb_convert_encoding($str, "EUC-JP', "auto");

例子:
$content = iconv("GBK", "UTF-8", $content);
$content = mb_convert_encoding($content, "UTF-8", "GBK");

PHP 相关文章推荐
PHP 获取目录下的图片并随机显示的代码
Dec 28 PHP
8个出色的WordPress SEO插件收集
Feb 26 PHP
那些年一起学习的PHP(三)
Mar 22 PHP
PHP获取MSN好友列表类的实现代码
Jun 23 PHP
PHP函数分享之curl方式取得数据、模拟登陆、POST数据
Jun 04 PHP
php使用pdo连接报错Connection failed SQLSTATE的解决方法
Dec 15 PHP
通过php添加xml文档内容的方法
Jan 23 PHP
php实现遍历多维数组的方法
Nov 25 PHP
php中的异常和错误浅析
May 03 PHP
TP5(thinkPHP5)框架基于ajax与后台数据交互操作简单示例
Sep 03 PHP
小程序微信支付功能配置方法示例详解【基于thinkPHP】
May 05 PHP
让你的PHP,APACHE,NGINX支持大文件上传
Mar 09 PHP
php printf输出格式使用说明
Dec 05 #PHP
PHP执行zip与rar解压缩方法实现代码
Dec 05 #PHP
smarty模板嵌套之include与fetch性能测试
Dec 05 #PHP
php 学习资料零碎东西
Dec 04 #PHP
PHP访问MYSQL数据库封装类(附函数说明)
Dec 04 #PHP
PHP验证码类代码( 最新修改,完全定制化! )
Dec 02 #PHP
PHP项目开发中最常用的自定义函数整理
Dec 02 #PHP
You might like
使用 MySQL Date/Time 类型
2008/03/26 PHP
php getcwd与dirname(__FILE__)区别详解
2016/09/24 PHP
laravel框架数据库操作、查询构建器、Eloquent ORM操作实例分析
2019/12/20 PHP
用javascript实现自定义标签
2007/05/08 Javascript
利用location.hash实现跨域iframe自适应
2010/05/04 Javascript
JavaScript 模拟类机制及私有变量的方法及思路
2013/07/10 Javascript
做好七件事帮你提升jQuery的性能
2014/02/06 Javascript
PHPMyAdmin导入时提示文件大小超出PHP限制的解决方法
2015/03/30 Javascript
javascript中SetInterval与setTimeout的定时器用法
2015/08/24 Javascript
微信小程序网络请求wx.request详解及实例
2017/05/18 Javascript
浅谈react+es6+webpack的基础配置
2017/08/09 Javascript
详解vue 数据传递的方法
2018/04/19 Javascript
以v-model与promise两种方式实现vue弹窗组件
2018/05/21 Javascript
js array数组对象操作方法汇总
2019/03/18 Javascript
在vue中使用setInterval的方法示例
2019/04/16 Javascript
webpack4 SplitChunks实现代码分隔详解
2019/05/23 Javascript
AI小程序之语音听写来了,十分钟掌握百度大脑语音听写全攻略
2020/03/13 Javascript
解决vue侦听器watch,调用this时出现undefined的问题
2020/10/30 Javascript
JavaScript实现点击图片换背景
2020/11/20 Javascript
python中遍历文件的3个方法
2014/09/02 Python
Django开发中的日志输出的方法
2018/07/02 Python
Python调用Windows API函数编写录音机和音乐播放器功能
2020/01/05 Python
使用Python实现牛顿法求极值
2020/02/10 Python
pyinstaller打包成无控制台程序时运行出错(与popen冲突的解决方法)
2020/04/15 Python
python使用正则表达式匹配txt特定字符串(有换行)
2020/12/09 Python
英国女士家居服网站:hush
2017/08/09 全球购物
幼儿教师培训感言
2014/03/08 职场文书
高一学生评语大全
2014/04/25 职场文书
活动倡议书范文
2014/05/13 职场文书
离婚协议书范本(通用篇)
2014/11/30 职场文书
悬空寺导游词
2015/02/05 职场文书
2015年村计划生育工作总结
2015/04/28 职场文书
读《钢铁是怎样炼成的》有感:百炼方成钢
2019/11/05 职场文书
高端收音机+蓝牙音箱,JBL TUNER FM带收音蓝牙音箱评测
2021/04/24 无线电
mysql 索引合并的使用
2021/08/30 MySQL
基于Python和openCV实现图像的全景拼接详细步骤
2021/10/05 Python