在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
PHP中的函数嵌套层数限制分析
Jun 13 PHP
简单的php写入数据库类代码分享
Jul 26 PHP
php数组函数序列之rsort() - 对数组的元素值进行降序排序
Nov 02 PHP
php笔记之:数据类型与常量的使用分析
May 14 PHP
使用dump函数,给php加断点测试
Jun 25 PHP
php实现用手机关闭计算机(电脑)的方法
Apr 22 PHP
php实现将Session写入数据库
Jul 26 PHP
在WordPress的文章编辑器中设置默认内容的方法
Dec 29 PHP
详解YII关联查询
Jan 10 PHP
PHP实现截取中文字符串不出现?号的解决方法
Dec 29 PHP
使用PHP+MySql+Ajax+jQuery实现省市区三级联动功能示例
Sep 15 PHP
laravel利用中间件做防非法登录和权限控制示例
Oct 21 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
受疫情影响 动画《Re从零开始的异世界生活》第二季延期至7月
2020/03/10 日漫
php中函数的形参与实参的问题说明
2010/09/01 PHP
基于php-fpm的配置详解
2013/06/03 PHP
php网站判断用户是否是手机访问的方法
2013/11/01 PHP
Jquery实战_读书笔记2 选择器
2010/01/22 Javascript
JavaScript 面向对象编程(1) 基础
2010/05/18 Javascript
JavaScript入门之对象与JSON详解
2011/10/21 Javascript
Jquery EasyUI中弹出确认对话框以及加载效果示例代码
2014/02/13 Javascript
zeroclipboard 单个复制按钮和多个复制按钮的实现方法
2014/06/14 Javascript
js简单的点击返回顶部效果实现方法
2015/04/10 Javascript
JavaScript+canvas实现七色板效果实例
2016/02/18 Javascript
基于JavaScript实现轮播图代码
2016/07/14 Javascript
JavaScript学习笔记整理_关于表达式和语句
2016/09/19 Javascript
微信小程序 tabs选项卡效果的实现
2017/01/05 Javascript
送你43道JS面试题(收藏)
2019/06/17 Javascript
微信小程序分享小程序码的生成(带参数)以及参数的获取
2020/03/25 Javascript
解决vue项目,npm run build后,报路径错的问题
2020/08/13 Javascript
vue element实现表格合并行数据
2020/11/30 Vue.js
[03:15]2014DOTA2国际邀请赛 专访国士无双信心满满
2014/07/12 DOTA
Python中的startswith和endswith函数使用实例
2014/08/25 Python
python将秒数转化为时间格式的实例
2018/09/16 Python
python中协程实现TCP连接的实例分析
2018/10/14 Python
Python中函数参数匹配模型详解
2019/06/09 Python
python脚本执行CMD命令并返回结果的例子
2019/08/14 Python
Python中Subprocess的不同函数解析
2019/12/10 Python
tensorflow ckpt模型和pb模型获取节点名称,及ckpt转pb模型实例
2020/01/21 Python
python实现FTP循环上传文件
2020/03/20 Python
Pycharm2020.1安装中文语言插件的详细教程(不需要汉化)
2020/08/07 Python
CSS3 transition 实现通知消息轮播条
2020/10/14 HTML / CSS
美国领先的眼镜和太阳镜在线零售商:Glasses.com
2019/08/26 全球购物
销售类个人求职信范文
2013/09/25 职场文书
考试违纪检讨书
2014/02/02 职场文书
2014年部门工作总结
2014/11/12 职场文书
小学生作文批改评语
2014/12/25 职场文书
2015年司机年终工作总结
2015/05/14 职场文书
python3读取文件指定行的三种方法
2021/05/24 Python