用PHP将Unicode 转化为UTF-8的实现方法(推荐)


Posted in PHP onFebruary 08, 2017

实例如下:

function unescape($str) {
  $str = rawurldecode($str);
  preg_match_all("/(?:%u.{4})|&#x.{4};|&#\d+;|.+/U",$str,$r);
  $ar = $r[0];
  //print_r($ar);
  foreach($ar as $k=>$v) {
    if(substr($v,0,2) == "%u"){
      $ar[$k] = iconv("UCS-2BE","UTF-8",pack("H4",substr($v,-4)));
 }
    elseif(substr($v,0,3) == "&#x"){
      $ar[$k] = iconv("UCS-2BE","UTF-8",pack("H4",substr($v,3,-1)));
 }
    elseif(substr($v,0,2) == "&#") {
       
      $ar[$k] = iconv("UCS-2BE","UTF-8",pack("n",substr($v,2,-1)));
    }
  }
  return join("",$ar);
}
echo unescape("紫星蓝");

今天有用户反馈,表单系统用户提交的数据中文会乱码。测试发现问题出在 iconv 转换上。
iconv('UCS-2',
'GBK',
'中文')
Google

搜索发现,原因是 Linux 服务器上 UCS-2 编码方式与 Winodws 不一致。

于是,我改成

 iconv('UCS-2BE',
'GBK',
'中文')
 试试,中文正常了

以下是有关两个平台

UCS-2 编码的潜规则:

1、 UCS-2 不等于 UTF-16。 UTF-16 每个字节使用 ASCII 字符范围编码,而 UCS-2 对每个字节的编码可以超出 ASCII 字符范围。UCS-2 和 UTF-16 对每个字符至多占两个字节,但是他们的编码是不一样的。

2、对于 UCS-2, windows 下默认是 UCS-2LE。用 MultibyteToWidechar(或者A2W)生成的是 UCS-2LE 的 unicode。windows记事本可以将文本保存为 UCS-2BE,相当于多了层转换。

3、 对于 UCS-2, linux 下默认是 UCS-2BE。用iconv(指定UCS-2)来转换生成的是 UCS-2BE 的 unicode。如果转换windows平台过来的 UCS-2, 需要指定 UCS-2LE。

4、鉴于windows和linux等多个平台对 UCS-2 的理解不同(UCS-2LE,UCS-2BE)。MS 主张 unicode 有个引导标志(UCS-2LE FFFE, UCS-2BE FEFF),以表明下面的字符是 unicode 并且判别 big-endian 或 little-endian。 所以从 windows 平台过来的数据发现有这个前缀,不用慌张。

5、 linux 的编码输出,比如从文件输出,从 printf 输出,需要控制台做适当的编码匹配(如果编码不匹配,一般和该程序编译时的编码有若干关系),而控制台的转换输入需要查看当前的系统编码。比如控制台当前的编码是 UTF-8, 那么 UTF-8 编码的东西能正确显示,GBK 就不能;同样,当前编码是 GBK, 就能显示 GBK 编码,后来的系统应该更智能的处理好更多的转换了。不过通过 putty 等终端还是需要设置好终端的编码转换以解除乱码的烦恼。

以上这篇用PHP将Unicode 转化为UTF-8的实现方法(推荐)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

PHP 相关文章推荐
聊天室php&mysql(四)
Oct 09 PHP
用PHP进行MySQL删除记录操作代码
Jun 07 PHP
PHP实现Soap通讯的方法
Nov 03 PHP
php数组转成json格式的方法
Mar 09 PHP
php编写的一个E-mail验证类
Mar 25 PHP
PHP使用缓存即时输出内容(output buffering)的方法
Aug 03 PHP
PHP数学运算函数大汇总(经典值得收藏)
Apr 01 PHP
Yii遍历行下每列数据的方法
Oct 17 PHP
PHP使用PDO访问oracle数据库的步骤详解
Sep 29 PHP
PHP使用标准库spl实现的观察者模式示例
Aug 04 PHP
php实现的简单多进程服务器类完整示例
Feb 01 PHP
PHP正则表达式函数preg_replace用法实例分析
Jun 04 PHP
一键生成各种尺寸Icon的php脚本(实例)
Feb 08 #PHP
php正则提取html图片(img)src地址与任意属性的方法
Feb 08 #PHP
PHP正则匹配反斜杠'\'和美元'$'的方法
Feb 08 #PHP
php利用嵌套数组拼接与解析json的方法
Feb 07 #PHP
php获取文件名称和扩展名的方法
Feb 07 #PHP
php 常用的系统函数
Feb 07 #PHP
thinkphp修改配置进入默认首页的方法
Feb 07 #PHP
You might like
虹吸式咖啡壶操作
2021/03/03 冲泡冲煮
PHP 在线翻译函数代码
2009/05/07 PHP
PHP生成指定随机字符串的简单实现方法
2015/04/01 PHP
详解Yaf框架PHPUnit集成测试方法
2017/12/27 PHP
Kibo 用于处理键盘事件的Javascript工具库
2011/10/28 Javascript
js写一个字符串转成驼峰的实例
2013/06/21 Javascript
javascript 3d 逐侦产品展示(核心精简)
2014/03/26 Javascript
jquery模拟LCD 时钟的html文件源代码
2014/06/16 Javascript
JavaScript中的类(Class)详细介绍
2014/12/30 Javascript
js实现的二级横向菜单条实例
2015/08/22 Javascript
文件上传,iframe跨域数据提交的实现
2016/11/18 Javascript
angular+bootstrap的双向数据绑定实例
2017/03/03 Javascript
nodejs制作爬虫实现批量下载图片
2017/05/19 NodeJs
vue页面跳转后返回原页面初始位置方法
2018/02/11 Javascript
Vuex中mutations与actions的区别详解
2018/03/01 Javascript
Vue.js上传图片到阿里云OSS存储的方法示例
2018/12/13 Javascript
js实现unicode码字符串与utf8字节数据互转详解
2019/03/21 Javascript
mpvue实现小程序签到金币掉落动画(api实现)
2019/10/17 Javascript
Vue elementui字体图标显示问题解决方案
2020/08/18 Javascript
Python的垃圾回收机制深入分析
2014/07/16 Python
在服务器端实现无间断部署Python应用的教程
2015/04/16 Python
python实现字典(dict)和字符串(string)的相互转换方法
2017/03/01 Python
Python使用Matplotlib模块时坐标轴标题中文及各种特殊符号显示方法
2018/05/04 Python
python的pyecharts绘制各种图表详细(附代码)
2019/11/11 Python
Python实现把多维数组展开成DataFrame
2019/11/30 Python
Python项目打包成二进制的方法
2020/12/30 Python
HTML5实现页面切换激活的PageVisibility API使用初探
2016/05/13 HTML / CSS
Wiggle中国:英国骑行、跑步、游泳 & 铁三运动装备专卖网店
2016/08/02 全球购物
行政主管岗位职责
2013/11/18 职场文书
考试没考好检讨书
2014/01/31 职场文书
班级道德讲堂实施方案
2014/02/24 职场文书
庆六一活动总结
2014/08/29 职场文书
你喜欢篮球吗?Python实现篮球游戏
2021/06/11 Python
详细介绍Next.js脚手架完整搭建封装
2022/04/26 Javascript
java实现web实时消息推送的七种方案
2022/07/23 Java/Android
win10滚动条自动往上跑怎么办?win10滚动条自动往上跑的解决方法
2022/08/05 数码科技