在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
一次编写,随处运行
Oct 09 PHP
如何使用PHP中的字符串函数
Nov 24 PHP
一个PHP日历程序
Dec 06 PHP
用PHP函数解决SQL injection
Dec 09 PHP
discuz程序的PHP加密函数原理分析
Aug 05 PHP
PHP随机字符串生成代码(包括大小写字母)
Jun 24 PHP
php实现的美国50个州选择列表实例
Apr 20 PHP
PHP实现根据银行卡号判断银行
Apr 29 PHP
CentOS下PHP7的编译安装及MySQL的支持和一些常见问题的解决办法
Dec 17 PHP
PHP 绘制网站登录首页图片验证码
Apr 12 PHP
PHP面向对象之工作单元(实例讲解)
Jun 26 PHP
tp5.1 框架join方法用法实例分析
May 26 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
用PHP读取IMAP邮件
2006/10/09 PHP
使用Sphinx对索引进行搜索
2013/06/25 PHP
php使用ob_flush不能每隔一秒输出原理分析
2015/06/02 PHP
关于PHP 如何用 curl 读取 HTTP chunked 数据
2016/02/26 PHP
在javascript中对于DOM的加强
2013/04/11 Javascript
jsp+javascript打造级连菜单的实例代码
2013/06/14 Javascript
jQuery写fadeTo示例代码
2014/02/21 Javascript
jquery+php实现搜索框自动提示
2014/11/28 Javascript
微信小程序 时间格式化(util.formatTime(new Date))详解
2016/11/16 Javascript
Nodejs之http的表单提交
2017/07/07 NodeJs
vue2.0项目中使用Ueditor富文本编辑器示例代码
2017/08/14 Javascript
vue axios 二次封装的示例代码
2017/12/08 Javascript
使用socket.io制做简易WEB聊天室
2018/01/02 Javascript
使用vue实现grid-layout功能实例代码
2018/01/05 Javascript
Vue页面骨架屏的实现方法
2018/05/22 Javascript
微信小程序组件传值图示过程详解
2019/07/31 Javascript
VUE的history模式下除了index外其他路由404报错解决办法
2019/08/21 Javascript
JavaScript实现轮播图片完整代码
2020/03/07 Javascript
Python判断文件或文件夹是否存在的三种方法
2017/07/27 Python
Python之两种模式的生产者消费者模型详解
2018/10/26 Python
python内置函数sorted()用法深入分析
2019/10/08 Python
在python中利用try..except来代替if..else的用法
2019/12/19 Python
浅谈Tensorflow 动态双向RNN的输出问题
2020/01/20 Python
MATLAB数学建模之画图汇总
2020/07/16 Python
Python如何对齐字符串
2020/07/30 Python
Numpy中的数组搜索中np.where方法详细介绍
2021/01/08 Python
html5摇一摇代码优化包括DeviceMotionEvent等等
2014/09/01 HTML / CSS
浅谈Html5中视频 音频标签 进度条的问题
2016/07/26 HTML / CSS
销售所有的狗狗产品:Dog.com
2016/10/13 全球购物
新锐科技Java程序员面试题
2016/07/25 面试题
自荐信不宜过于夸大
2013/11/06 职场文书
档案保密承诺书
2014/06/03 职场文书
志愿者宣传口号
2014/06/17 职场文书
2014年残疾人工作总结
2014/12/06 职场文书
党员个人自我评价
2015/03/03 职场文书
java协程框架quasar和kotlin中的协程对比分析
2022/02/24 Java/Android