在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
杏林同学录(一)
Oct 09 PHP
php中的注释、变量、数组、常量、函数应用介绍
Nov 16 PHP
PHP中模拟处理HTTP PUT请求的例子
Jul 22 PHP
MyEclipse常用配置图文教程
Sep 11 PHP
PHP MYSQL简易交互式站点开发
Dec 27 PHP
ThinkPHP 模板substr的截取字符串函数详解
Jan 09 PHP
yii2 commands模式以及配置crontab定时任务的方法
Aug 19 PHP
PHP长连接实现与使用方法详解
Feb 11 PHP
PHP实现通过CURL上传文件功能示例
May 30 PHP
PHP命名空间简单用法示例
Dec 28 PHP
tp5框架无刷新分页实现方法分析
Sep 26 PHP
laravel 解决路由除了根目录其他都404的问题
Oct 18 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
PHP+jQuery 注册模块的改进(三):更新到Smarty3.1
2014/10/14 PHP
php版微信自定义回复功能示例
2016/12/05 PHP
PHP利用递归函数实现无限级分类的方法
2019/03/22 PHP
PHP大文件分块上传功能实例详解
2019/07/22 PHP
jquery 之 $().hover(func1, funct2)使用方法
2012/06/14 Javascript
用jQuery实现的智能隐藏、滑动效果的返回顶部代码
2014/03/18 Javascript
jQuery实现的图文高亮滚动切换特效实例
2015/08/10 Javascript
SpringMVC restful 注解之@RequestBody进行json与object转换
2015/12/10 Javascript
javascript中json基础知识详解
2017/01/19 Javascript
bootstrap table表格使用方法详解
2017/04/26 Javascript
JavaScript闭包原理与用法实例分析
2018/08/10 Javascript
详解vue更改头像功能实现
2019/04/28 Javascript
微信小程序自定义toast组件的方法详解【含动画】
2019/05/11 Javascript
5分钟教你用nodeJS手写一个mock数据服务器的方法
2019/09/10 NodeJs
vuex实现像调用模板方法一样调用Mutations方法
2019/11/06 Javascript
微信小程序页面渲染实现方法
2019/11/06 Javascript
Python 开发Activex组件方法
2009/11/08 Python
老生常谈Python之装饰器、迭代器和生成器
2017/07/26 Python
Python实现可设置持续运行时间、线程数及时间间隔的多线程异步post请求功能
2018/01/11 Python
python读取文件名称生成list的方法
2018/04/27 Python
windows下安装Python的XlsxWriter模块方法
2018/05/03 Python
python如何查看微信消息撤回
2018/11/27 Python
创建Shapefile文件并写入数据的例子
2019/11/26 Python
利用python下载scihub成文献为PDF操作
2020/07/09 Python
简单的命令查看安装的python版本号
2020/08/28 Python
Python爬虫之Selenium库的使用方法
2021/01/03 Python
python3定位并识别图片验证码实现自动登录功能
2021/01/29 Python
Linden Leaves官网:新西兰纯净护肤品
2020/12/20 全球购物
领班岗位职责范文
2014/02/06 职场文书
法律专业自荐信
2014/06/03 职场文书
2014幼儿园教师师德师风演讲稿
2014/09/10 职场文书
中学生的1000字检讨书
2014/10/11 职场文书
学校教学工作总结2015
2015/05/19 职场文书
个人收入证明格式
2015/06/24 职场文书
2015暑期爱心支教策划书
2015/07/14 职场文书
导游词之海南天涯海角
2019/12/05 职场文书