在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
WINDOWS 2000下使用ISAPI方式安装PHP
Sep 05 PHP
php图片上传存储源码并且可以预览
Aug 26 PHP
利用Ffmpeg获得flv视频缩略图和视频时间的代码
Sep 15 PHP
无JS,完全php面向过程数据分页实现代码
Aug 27 PHP
PHP使用xmllint命令处理xml与html的方法
Dec 15 PHP
WordPress主题制作之模板文件的引入方法
Dec 28 PHP
浅析PHP中的i++与++i的区别及效率
Jun 15 PHP
Yii2实现跨mysql数据库关联查询排序功能代码
Feb 10 PHP
PHP培训要多少钱
Jun 06 PHP
PHP 7.1中AES加解密方法mcrypt_module_open()的替换方案
Oct 17 PHP
PHP实现的字符串匹配算法示例【sunday算法】
Dec 19 PHP
PHP实现可精确验证身份证号码的工具类示例
May 31 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
缓存技术详谈―php
2006/12/14 PHP
ionCube 一款类似zend的PHP加密/解密工具
2010/07/25 PHP
php中DOMDocument简单用法示例代码(XML创建、添加、删除、修改)
2010/12/19 PHP
ecshop 批量上传(加入自定义属性)
2012/03/20 PHP
3种php生成唯一id的方法
2015/11/23 PHP
基于ThinkPHP5.0实现图片上传插件
2017/09/25 PHP
PHP类与对象后期静态绑定操作实例详解
2018/12/20 PHP
filters.revealTrans.Transition使用方法小结
2010/08/19 Javascript
jquery each()源代码
2011/02/14 Javascript
jquery.tmpl JQuery模板插件
2011/10/10 Javascript
js向上无缝滚动,网站公告效果 具体代码
2013/11/18 Javascript
node.js中的fs.readlink方法使用说明
2014/12/17 Javascript
JS集成fckeditor及判断内容是否为空的方法
2016/05/27 Javascript
AngularJS基础 ng-model-options 指令简单示例
2016/08/02 Javascript
js实现按钮控制带有停顿效果的图片滚动
2016/08/30 Javascript
JS数组排序方法实例分析
2016/12/16 Javascript
详解使用vue-admin-template的优化历程
2018/05/20 Javascript
webpack4.x打包过程详解
2018/07/18 Javascript
在vue中解决提示警告 for循环报错的方法
2018/09/28 Javascript
如何去除富文本中的html标签及vue、react、微信小程序中的过滤器
2018/11/21 Javascript
vue回到顶部监听滚动事件详解
2019/08/02 Javascript
详解Python 2.6 升级至 Python 2.7 的实践心得
2017/04/27 Python
轻量级的Web框架Flask 中模块化应用的实现
2017/09/11 Python
Python模块搜索路径代码详解
2018/01/29 Python
Python os.access()用法实例
2019/02/18 Python
django自带serializers序列化返回指定字段的方法
2019/08/21 Python
django实现将后台model对象转换成json对象并传递给前端jquery
2020/03/16 Python
HTML5网页音乐播放器的示例代码
2017/11/09 HTML / CSS
详解html2canvas截图不能截取圆角图片的解决方案
2018/01/30 HTML / CSS
美国保健品专家:Life Extension
2018/05/04 全球购物
澳大利亚设计师服装在线:MISHA
2019/10/07 全球购物
高校群众路线教育实践活动剖析材料
2014/10/10 职场文书
元宵节寄语大全
2015/02/27 职场文书
公司晚会主持词
2019/04/17 职场文书
pycharm2021激活码使用教程(永久激活亲测可用)
2021/03/30 Python
Nginx工作原理和优化总结。
2021/04/02 Servers