在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
PHP 5.3新特性命名空间规则解析及高级功能
Mar 11 PHP
php截取utf-8中文字符串乱码的解决方法
Mar 29 PHP
PHP URL地址获取函数代码(端口等) 推荐
May 15 PHP
推荐一本PHP程序猿都应该拜读的书
Dec 31 PHP
php约瑟夫问题解决关于处死犯人的算法
Mar 23 PHP
编写PHP脚本来实现WordPress中评论分页的功能
Dec 10 PHP
在Win2003(64位)中配置IIS6+PHP5.2.17+MySQL5.5的运行环境
Apr 04 PHP
详解Yii2.0 rules验证规则集合
Mar 21 PHP
PHP编程实现计算抽奖概率算法完整实例
Aug 09 PHP
PHP设计模式之模板模式定义与用法详解
Dec 20 PHP
Laravel Eloquent ORM 实现查询表中指定的字段
Oct 17 PHP
thinkPHP框架乐观锁和悲观锁实例分析
Oct 30 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
PHP面向对象的使用教程 简单数据库连接
2006/11/25 PHP
php使浏览器直接下载pdf文件的方法
2013/11/15 PHP
php数组操作之键名比较与差集、交集赋值的方法
2014/11/10 PHP
php版微信公众号接口实现发红包的方法
2016/10/14 PHP
限制复选框的最大可选数
2006/07/01 Javascript
深入理解JavaScript系列(16) 闭包(Closures)
2012/04/12 Javascript
JQuery事件e参数的方法preventDefault()取消默认行为
2013/09/26 Javascript
javascript正则匹配汉字、数字、字母、下划线
2014/04/10 Javascript
jQuery循环动画与获取组件尺寸的方法
2015/02/02 Javascript
js贪吃蛇网页版游戏特效代码分享(挑战十关)
2015/08/24 Javascript
jQuery插件Timelinr 实现时间轴特效
2015/10/04 Javascript
Angular中ng-bind和ng-model的区别实例详解
2017/04/10 Javascript
jQuery插件FusionCharts绘制的3D双柱状图效果示例【附demo源码】
2017/04/20 jQuery
vue2.x 父组件监听子组件事件并传回信息的方法
2017/07/17 Javascript
jQuery NProgress.js加载进度插件的简单使用方法
2018/01/31 jQuery
浅谈react受控组件与非受控组件(小结)
2018/02/09 Javascript
浅谈Node框架接入ELK实践总结
2019/02/22 Javascript
ES6中let、const的区别及变量的解构赋值操作方法实例分析
2019/10/15 Javascript
使用Python的判断语句模拟三目运算
2015/04/24 Python
Python类属性与实例属性用法分析
2015/05/09 Python
python实现的希尔排序算法实例
2015/07/01 Python
Python中int()函数的用法浅析
2017/10/17 Python
Python爬虫 bilibili视频弹幕提取过程详解
2019/07/31 Python
Django跨域资源共享问题(推荐)
2020/03/09 Python
Python爬取YY评级分数并保存数据实现过程解析
2020/06/01 Python
pyecharts在数据可视化中的应用详解
2020/06/08 Python
详解Python爬虫爬取博客园问题列表所有的问题
2021/01/18 Python
使用iframe+postMessage实现页面跨域通信的示例代码
2020/01/14 HTML / CSS
vivo智能手机官方商城:vivo
2016/09/22 全球购物
GWT (Google Web Toolkit)有哪些主要的原件组成?
2015/06/08 面试题
篮球社团活动总结
2014/06/27 职场文书
航海技术专业毕业生推荐信
2014/07/09 职场文书
写给医院的感谢信
2015/01/22 职场文书
2015年党员个人工作总结
2015/05/13 职场文书
怎样写家长意见
2015/06/04 职场文书
html网页引入svg图片的4种方式
2022/08/05 HTML / CSS