详解PHP用mb_string处理windows中文字符


Posted in PHP onMay 26, 2021

我们都知道windows中(当然是中文版),文件名和文件内容等编码都是gbk,而我们在开发过程中,IDE里的编码则是UTF-8,(这里不讨论为什么等等问题,只考虑怎么把编码转变成一样的)所以导致我写的UTF-8编码的正则模式字符串中的中文在gbk编码的文件中并不能正确匹配。

一开始,我并没有什么办法,试过把PHP脚本文件的编码也改成GBK,也可以用,但是想到这种方法太low了,所以找一找PHP中有没有函数可以满足我的需求。

这时,我想到了以前在处理windows中的文件名时用的函数iconv(),其函数原型如下:

stringiconv(string$in_charset,string$out_charset,string$str)

Performsacharactersetconversiononthestringstrfromin_charsettoout_charset.

我们常使用:

$out_charset='utf-8';

$fileName=iconv($fileName,$out_charset,'gbk');

来处理文件名,将文件名改从gbk改为UTF-8而内容不变。

手册翻译附加:

  • 如果你在输出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能转换为UTF-8的字符时,程序会自动替换为一个相似字符的UTF-8字符;
  • 如果你在输出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能转换为UTF-8的字符时,程序会自动跳过这个字符。
  • 如果你什么都没加,就在遇到不能替换成UTF-8的字符时,替换会被中断。

但是,我在用这个函数处理时,结果却是这样:

详解PHP用mb_string处理windows中文字符

意思是iconv()函数能处理的最大字符数只有64,一般的文件名大小,而我的文件内容很显然不止64个字符。

没有办法,我只好再次各种翻找别的函数。

直到我发现了mb_string函数库,这个函数库一般都在PHP环境里集成,我们可以在phpinfo()里找到它。

详解PHP用mb_string处理windows中文字符

mb_string函数里有一个mb_convert_encoding()函数,可以将一个字符串的编码改变,其函数原型如下:

stringmb_convert_encoding(string$str,string$to_encoding[,mixed$from_encoding])

Convertsthecharacterencodingofstringstrtoto_encodingfromoptionallyfrom_encoding.

基原型跟iconv()函数差不多,只是它没有对输出函数的后缀修饰,它也没有对字符串长度的明确限制。

而且我们看到$from_encoding是可选的,它可以自动识别源编码。

因为找不到一个确切的无法转码的字符,也不知道它遇到无法转码的字符会怎么处理。

通过mb_convert_encoding()函数,将整个文件处理了一下,于是,问题顺利解决。

最后介绍一下mb_string函数库,它全名叫MultibyteString,它的很多方法都扩展自PHP自身的string函数库,函数名在原函数的前面加了"mb_",这些函数除了拥有原函数的作用外,还在可选参数的最后加入了一个$encoding的可选参数,这个参数可以规定函数以什么样的编码方式来处理字符串。

例如strpos()函数,找到一个字符串在另一个字符串中的位置。

strpos("欢迎来访问","问",0)返回的结果是12,因为脚本是UTF-8编码,而将字符串转为UTF-8编码后,每个中文字符会占用3个字节。

而在mb_strpos()函数中,mb_strpos("欢迎来访问","问",0,'utf-8')则会返回4,它会将字符串当作已经转UTF-8的状态执行。

而mb_strpos("欢迎来访问","问",0,'gbk')会返回6

以上就是详解PHP用mb_string处理windows中文字符的详细内容,更多关于PHP用mb_string处理windows中文字符的资料请关注三水点靠木其它相关文章!

PHP 相关文章推荐
php下检测字符串是否是utf8编码的代码
Jun 28 PHP
php中explode与split的区别介绍
Oct 03 PHP
PHP屏蔽蜘蛛访问代码及常用搜索引擎的HTTP_USER_AGENT
Mar 06 PHP
php中通过curl检测页面是否被百度收录
Sep 27 PHP
关于php内存不够用的快速解决方法
Oct 26 PHP
PHP字符串的递增和递减示例介绍
Feb 11 PHP
PHP连接操作access数据库实例
Mar 30 PHP
php使用ob_flush不能每隔一秒输出原理分析
Jun 02 PHP
php中smarty实现多模版网站的方法
Jun 11 PHP
PHP中addslashes与mysql_escape_string的区别分析
Apr 25 PHP
php获取一定范围内取N个不重复的随机数
May 28 PHP
php简单随机字符串生成方法示例
Apr 19 PHP
详解PHP服务器如何在有限的资源里最大提升并发能力
详解PHP设计模式之依赖注入模式
阿里云服务器搭建Php+Apache运行环境的详细过程
php+laravel 扫码二维码签到功能
你真的了解PHP中的引用符号(&)吗
php中配置文件保存修改操作 如config.php文件的读取修改等操作
May 12 #PHP
php7中停止php-fpm服务的方法详解
May 09 #PHP
You might like
法国:浪漫之都的咖啡文化
2021/03/03 咖啡文化
DOMXML函数笔记
2006/10/09 PHP
关于Sphinx创建全文检索的索引介绍
2013/06/25 PHP
PHP计算2点经纬度之间的距离代码
2013/08/12 PHP
PHP永久登录、记住我功能实现方法和安全做法
2015/04/27 PHP
PHP/ThinkPHP实现批量打包下载文件的方法示例
2017/07/31 PHP
php下的原生ajax请求用法实例分析
2020/02/28 PHP
JQuery里选择超链接的实现代码
2011/05/22 Javascript
分享一个用Mootools写的鼠标滑过进度条改变进度值的实现代码
2011/12/12 Javascript
JavaScript面向对象程序设计三 原型模式(上)
2011/12/21 Javascript
13 个JavaScript 性能提升技巧分享
2012/07/26 Javascript
js复制到剪切板的实例方法
2013/06/28 Javascript
JS弹出层的显示与隐藏示例代码
2013/12/27 Javascript
jquery 使用简明教程
2014/03/05 Javascript
javascript日期格式化方法小结
2015/12/17 Javascript
Angular.Js之Scope作用域的学习教程
2017/04/27 Javascript
详解用node搭建简单的静态资源管理器
2017/08/09 Javascript
详解Angular6 热加载配置方案
2018/08/18 Javascript
vue实现循环切换动画
2018/10/17 Javascript
AngularJS实现的鼠标拖动画矩形框示例【可兼容IE8】
2019/05/17 Javascript
Vue.js组件props数据验证实现详解
2019/10/19 Javascript
vue中echarts的用法及与elementui-select的协同绑定操作
2020/11/17 Vue.js
vue-cli4.0多环境配置变量与模式详解
2020/12/30 Vue.js
[01:16:28]DOTA2-DPC中国联赛 正赛 iG vs Magma BO3 第二场 2月23日
2021/03/11 DOTA
Python中用format函数格式化字符串的用法
2015/04/08 Python
在Django中创建URLconf相关的通用视图的方法
2015/07/20 Python
朴素贝叶斯Python实例及解析
2018/11/19 Python
python实现网页自动签到功能
2019/01/21 Python
Python数据存储之 h5py详解
2019/12/26 Python
python字符串常用方法及文件简单读写的操作方法
2020/03/04 Python
pycharm实现print输出保存到txt文件
2020/06/01 Python
物理系毕业生自荐信
2013/11/01 职场文书
有针对性的求职自荐信
2013/11/14 职场文书
2015年暑期社会实践活动总结
2015/03/27 职场文书
python绘制箱型图
2021/04/27 Python
Django数据库(SQlite)基本入门使用教程
2022/07/07 Python