在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
学习使用PHP数组
Oct 09 PHP
?算你??的 PHP 程式大小
Dec 06 PHP
配置Apache2.2+PHP5+CakePHP1.2+MySQL5运行环境
Apr 25 PHP
PHP写MySQL数据 实现代码
Jun 15 PHP
php数组函数序列之array_intersect() 返回两个或多个数组的交集数组
Nov 10 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(二)
Jun 23 PHP
php使用parse_url和parse_str解析URL
Feb 22 PHP
详解PHP编码转换函数应用技巧
Oct 22 PHP
php 生成加密公钥加密私钥实例详解
Jun 16 PHP
PHP7扩展开发教程之Hello World实现方法示例
Aug 03 PHP
PHP微信H5支付开发实例
Jul 25 PHP
laravel添加角色和模糊搜索功能的实现代码
Jun 22 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
PHP模板引擎SMARTY
2006/10/09 PHP
PHP+FFMPEG实现将视频自动转码成H264标准Mp4文件
2014/09/24 PHP
Laravel 已登陆用户再次查看登陆页面的自动跳转设置方法
2019/09/30 PHP
PHP使用POP3读取邮箱接收邮件的示例代码
2020/07/08 PHP
不用ajax实现点击文字即可编辑的方法
2007/12/16 Javascript
利用jQuery操作对象数组的实现代码
2011/04/27 Javascript
JavaScript高级程序设计(第3版)学习笔记3 js简单数据类型
2012/10/11 Javascript
js浮点数精确计算(加、减、乘、除)
2013/12/26 Javascript
JQuery对表单元素的基本操作使用总结
2014/07/18 Javascript
理解Angular数据双向绑定
2016/01/10 Javascript
JavaScript中的Array 对象(数组对象)
2016/06/02 Javascript
JS实现动态添加DOM节点和事件的方法示例
2017/04/28 Javascript
详解Webpack DLL用法以及功能
2017/07/11 Javascript
vue基于Element构建自定义树的示例代码
2017/09/19 Javascript
利用javascript如何随机生成一定位数的密码
2017/09/22 Javascript
Vue的路由动态重定向和导航守卫实例
2018/03/17 Javascript
angular中两种表单的区别(响应式和模板驱动表单)
2018/12/06 Javascript
原生javascript中this几种常见用法总结
2020/02/24 Javascript
用webAPI实现图片放大镜效果
2020/11/23 Javascript
[01:56]2014DOTA2西雅图邀请赛 MVP外卡赛老队长精辟点评
2014/07/09 DOTA
Python跳出循环语句continue与break的区别
2014/08/25 Python
Python正则表达式教程之三:贪婪/非贪婪特性
2017/03/02 Python
对Tensorflow中的变量初始化函数详解
2018/07/27 Python
使用Python自动化破解自定义字体混淆信息的方法实例
2019/02/13 Python
基于Python打造账号共享浏览器功能
2019/05/30 Python
Python xlrd模块导入过程及常用操作
2020/06/10 Python
从python读取sql的实例方法
2020/07/21 Python
CSS3中的Transition过度与Animation动画属性使用要点
2016/05/20 HTML / CSS
NFL加拿大官方网上商店:NHLShop.ca
2019/03/12 全球购物
优秀员工评语
2014/02/10 职场文书
求职信怎么写
2014/05/23 职场文书
大学生助学金感谢信
2015/01/21 职场文书
董事长助理岗位职责
2015/02/11 职场文书
民政局未婚证明
2015/06/15 职场文书
2015小学音乐教师个人工作总结
2015/07/21 职场文书
2016教师给学生的毕业寄语
2015/12/04 职场文书