在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
《PHP边学边教》(02.Apache+PHP环境配置――下篇)
Dec 13 PHP
ZF等常用php框架中存在的问题
Jan 10 PHP
php数据结构与算法(PHP描述) 快速排序 quick sort
Jun 21 PHP
ajax在joomla中的原生态应用代码
Jul 19 PHP
PHP提示Notice: Undefined variable的解决办法
Nov 24 PHP
PHP批量生成静态HTML的简单原理和方法
Apr 20 PHP
PHP GD库生成图像的几个函数总结
Nov 19 PHP
PHP中set error handler函数用法小结
Nov 11 PHP
PHP 匿名函数与注意事项详细介绍
Nov 26 PHP
PHP进程通信基础之信号
Feb 19 PHP
Laravel 模型关联基础教程详解
Sep 17 PHP
Thinkphp5.0 框架使用模型Model添加、更新、删除数据操作详解
Oct 11 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
PHP出错界面
2006/10/09 PHP
php中文本操作的类
2007/03/17 PHP
ThinkPHP3.1新特性之查询条件预处理简介
2014/06/19 PHP
PHP查看当前变量类型的方法
2015/07/31 PHP
PHP中set_include_path()函数相关用法分析
2016/07/18 PHP
php 删除指定文件夹的实例讲解
2017/07/25 PHP
微信支付之JSAPI公众号支付详解
2019/05/15 PHP
jQuery图片预加载 等比缩放实现代码
2011/10/04 Javascript
js里取容器大小、定位、距离等属性搜集整理
2013/08/19 Javascript
javascript数组输出的两种方式
2015/01/13 Javascript
使用javascript实现判断当前浏览器
2015/04/14 Javascript
smartcrop.js智能图片裁剪库
2015/10/14 Javascript
非常漂亮的相册集 使用jquery制作相册集
2016/04/28 Javascript
Summernote实现图片上传功能的简单方法
2016/07/11 Javascript
Nodejs进阶:核心模块net入门学习与实例讲解
2016/11/21 NodeJs
老生常谈原生JS执行环境与作用域
2016/11/22 Javascript
微信小程序实现缓存根据不同的id来进行设置和读取缓存
2017/06/12 Javascript
node.js express中app.param的用法详解
2017/07/16 Javascript
jQuery实现手机号正则验证输入及自动填充空格功能
2018/01/02 jQuery
完美解决axios跨域请求出错的问题
2018/02/05 Javascript
vue实现微信分享链接添加动态参数的方法
2019/04/29 Javascript
elementUI 动态生成几行几列的方法示例
2019/07/11 Javascript
js实现查询商品案例
2020/07/22 Javascript
JS实现京东商品分类侧边栏
2020/12/11 Javascript
Python ORM框架SQLAlchemy学习笔记之数据添加和事务回滚介绍
2014/06/10 Python
Python爬虫番外篇之Cookie和Session详解
2017/12/27 Python
浅谈SciPy中的optimize.minimize实现受限优化问题
2020/02/29 Python
Python3如何使用多线程升程序运行速度
2020/08/11 Python
HTML5开发动态音频图的实现
2020/07/02 HTML / CSS
德国亚洲食品网上商店:asiafoodland.de
2019/12/28 全球购物
暑期社会实践证明书
2014/11/17 职场文书
2015年社会实践个人总结
2015/03/06 职场文书
道德与公民自我评价
2015/03/09 职场文书
2015企业年终工作总结范文
2015/05/27 职场文书
2015年清剿火患专项行动工作总结
2015/07/27 职场文书
《月歌。》宣布制作10周年纪念剧场版《RABBITS KINGDOM THE MOVIE》
2022/04/02 日漫