linux系统上支持php的 iconv()函数的方法


Posted in PHP onOctober 01, 2011

1、下载libiconv函数库http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.9.2.tar.gz;
2、解压缩tar -zxvf libiconv-1.9.2.tar.gz;
3、安装libiconv

#configure --prefix=/usr/local/iconv 
#make 
#make install

4、重新编译php 增加编译参数--with-iconv=/usr/local/iconv
windows下
最近在做一个小偷程序,需要用到iconv函数把抓取来过的utf-8编码的页面转成gb2312, 发现只有用iconv函数把抓取过来的数据一转码数据就会无缘无故的少一些。 让我郁闷了好一会儿,去网上一查资料才知道这是iconv函数的一个bug。iconv在转换字符"—"到gb2312时会出错
解决方法很简单,就是在需要转成的编码后加 "//IGNORE" 也就是iconv函数第二个参数后.如下:
以下为引用的内容:
iconv("UTF-8","GB2312//IGNORE",$data)
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。

iconv不是php的默认函数,也是默认安装的模块。需要安装才能用的。
如果是windows2000+php,你可以修改php.ini文件,将extension=php_iconv.dll前的";"去掉,同时你要copy你的原php安装文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是这个目录)
在linux环境下,用静态安装的方式,在configure时加多一项 --with-iconv就可以了,phpinfo看得到iconv的项。(Linux7.3+Apache4.06+php4.3.2),

下载:ftp://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.8.tar.gz
安装:

#cp libiconv-1.8.tar.gz /usr/local/src 
#tar zxvf lib* 
#./configure --prefix=/usr/local/libiconv 
#make 
#make install 
编译php 
#./configure --prefix=/usr/local/php4.3.2 --with-iconv=/usr/local/libiconv/

使用的简单例子:

<?php
echo iconv("gb2312","ISO-8859-1","我们");

PHP中的mb_convert_encoding与iconv函数介绍

mb_convert_encoding这个函数是用来转换编码的。原来一直对程序编码这一概念不理解,不过现在好像有点开窍了。
不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

< ?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
< ?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>

不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, "UCS-2LE”, "JIS, eucjp-win, sjis-win”);
/* "auto” is expanded to "ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, "EUC-JP”, "auto”);

例子:

$content = iconv(”GBK”, "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8", "GBK”);
PHP 相关文章推荐
实时抓取YAHOO股票报价的代码
Oct 09 PHP
PHP 开发工具
Dec 06 PHP
linux命令之调试工具strace的深入分析
Jun 03 PHP
php获取网页上所有链接的方法
Apr 03 PHP
详解WordPress开发中wp_title()函数的用法
Jan 07 PHP
thinkphp3.x中session方法的用法分析
May 20 PHP
Docker 如何布置PHP开发环境
Jun 21 PHP
轻松掌握php设计模式之访问者模式
Sep 23 PHP
详解Yii实现分页的两种方法
Jan 14 PHP
php获取目录中所有文件名及判断文件与目录的简单方法
Mar 04 PHP
动态表单验证的操作方法和TP框架里面的ajax表单验证
Jul 19 PHP
Yii2结合Workerman的websocket示例详解
Sep 10 PHP
php中mysql模块部分功能的简单封装
Sep 30 #PHP
php XMLWriter类的简单示例代码(RSS输出)
Sep 30 #PHP
简单的PHP缓存设计实现代码
Sep 30 #PHP
php利用iframe实现无刷新文件上传功能的代码
Sep 29 #PHP
php json_encode奇怪问题说明
Sep 27 #PHP
PHP安全配置详细说明
Sep 26 #PHP
使用PHP遍历文件夹与子目录的函数代码
Sep 26 #PHP
You might like
input file获得文件根目录简单实现
2013/04/26 PHP
PHP程序员的技术成长规划
2016/03/25 PHP
PHP+sqlite数据库操作示例(创建/打开/插入/检索)
2016/05/26 PHP
PHP中include()与require()的区别说明
2017/02/14 PHP
PHP7.1实现的AES与RSA加密操作示例
2018/06/15 PHP
解决在laravel中leftjoin带条件查询没有返回右表为NULL的问题
2019/10/15 PHP
使用git迁移Laravel项目至新开发环境的步骤详解
2020/04/06 PHP
jQuery toggle()设置CSS样式
2009/11/05 Javascript
使用PHP+JQuery+Ajax分页的实现
2013/04/23 Javascript
HTML5使用DeviceOrientation实现摇一摇功能
2015/06/05 Javascript
关于JavaScript限制字数的输入框的那些事
2016/08/14 Javascript
jQuery控制控件文本的长度的操作方法
2016/12/05 Javascript
JavaScript原生节点操作小结
2017/01/17 Javascript
js时间戳格式化成日期格式的多种方法介绍
2017/02/16 Javascript
js时间戳转yyyy-MM-dd HH-mm-ss工具类详解
2019/04/30 Javascript
微信小程序引入Vant组件库过程解析
2019/08/06 Javascript
微信小程序自定义导航栏(模板化)
2019/11/15 Javascript
ES6学习教程之Promise用法详解
2020/11/22 Javascript
[35:27]完美世界DOTA2联赛循环赛 GXR vs FTD BO2第二场 10.29
2020/10/29 DOTA
编写Python脚本使得web页面上的代码高亮显示
2015/04/24 Python
详解Python如何获取列表(List)的中位数
2016/08/12 Python
Python基于pillow判断图片完整性的方法
2016/09/18 Python
六行python代码的爱心曲线详解
2019/05/17 Python
tensorflow 实现打印pb模型的所有节点
2020/01/23 Python
使用Python第三方库pygame写个贪吃蛇小游戏
2020/03/06 Python
Visual Studio Code搭建django项目的方法步骤
2020/09/17 Python
CSS3中Color的一些特性介绍
2012/05/27 HTML / CSS
HTML5 video 事件应用示例
2014/09/11 HTML / CSS
《七颗钻石》教学反思
2014/02/28 职场文书
医学生自我鉴定范文
2014/03/26 职场文书
2014年群众路线党员自我评议
2014/09/24 职场文书
诉讼授权委托书范本
2014/10/05 职场文书
三年级上册科学教学计划
2015/01/21 职场文书
2015年敬老院工作总结
2015/05/18 职场文书
2016年3月份红领巾广播稿
2015/12/21 职场文书
一文搞懂MySQL索引页结构
2022/02/28 MySQL