在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
php中sql注入漏洞示例 sql注入漏洞修复
Jan 24 PHP
php数组去重复数据示例
Feb 25 PHP
php随机显示指定文件夹下图片的方法
Jul 13 PHP
Mac版PhpStorm之XAMPP整合apache服务器配置的图文教程详解
Oct 13 PHP
PHP利用超级全局变量$_POST来接收表单数据的实例
Nov 05 PHP
详解Yii2 定制表单输入字段的标签和样式
Jan 04 PHP
php实现mysql连接池效果实现代码
Jan 25 PHP
PHP实现通过CURL上传文件功能示例
May 30 PHP
PHP开启目录引索+fancyindex漂亮目录浏览带搜索功能
Sep 23 PHP
PHP实现发送微博消息功能完整示例
Dec 04 PHP
Yii 框架使用数据库(databases)的方法示例
May 19 PHP
PHP正则表达式之RCEService回溯
Apr 11 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
PHP按行读取文件时删除换行符的3种方法
2014/05/04 PHP
Php-Redis安装测试笔记
2015/03/05 PHP
深入解析PHP的Yii框架中的缓存功能
2016/03/29 PHP
javascript Window及document对象详细整理
2011/01/12 Javascript
JS Replace()的高级使用方法介绍
2013/06/29 Javascript
javascript实现跳转菜单的具体方法
2013/07/05 Javascript
JavaScript中的连字符详解
2013/11/28 Javascript
百度判断手机终端并自动跳转js代码及使用实例
2014/06/11 Javascript
jQuery删除一个元素后淡出效果展示删除过程的方法
2015/03/18 Javascript
js clearInterval()方法的定义和用法
2015/11/11 Javascript
Bootstrap时间选择器datetimepicker和daterangepicker使用实例解析
2016/09/17 Javascript
JS中mouseup事件丢失的原因与解决办法
2017/06/14 Javascript
js图片放大镜实例讲解(必看篇)
2017/07/17 Javascript
使用vue2.6实现抖音【时间轮盘】屏保效果附源码
2019/04/24 Javascript
Vue使用vue-draggable 插件在不同列表之间拖拽功能
2020/03/12 Javascript
Vue element-ui父组件控制子组件的表单校验操作
2020/07/17 Javascript
Python Tkinter基础控件用法
2014/09/03 Python
Python中的生成器和yield详细介绍
2015/01/09 Python
Python数据类型详解(二)列表
2016/05/08 Python
Python MySQLdb 使用utf-8 编码插入中文数据问题
2018/03/13 Python
python读写csv文件的方法
2019/08/13 Python
基于python及pytorch中乘法的使用详解
2019/12/27 Python
python两个list[]相加的实现方法
2020/09/23 Python
英国受欢迎的运动鞋和街头服装商店:Footasylum
2018/06/12 全球购物
Made in Design德国:设计师家具、灯具和装饰
2019/10/31 全球购物
精伦电子Java笔试题
2013/01/16 面试题
广州一家公司的.NET面试题
2016/06/11 面试题
超市后勤自我鉴定
2014/01/17 职场文书
《两只鸟蛋》教学反思
2014/02/10 职场文书
班级道德讲堂实施方案
2014/02/24 职场文书
工作能力自我评价2015
2015/03/05 职场文书
初中数学课堂教学反思
2016/02/17 职场文书
如何书写民事调解协议书?
2019/06/25 职场文书
创业计划书之蛋糕店
2019/08/29 职场文书
html输入两个数实现加减乘除功能
2021/07/01 HTML / CSS
MySQL空间数据存储及函数
2021/09/25 MySQL