详解PHP用mb_string处理windows中文字符


Posted in PHP onMay 26, 2021

我们都知道windows中(当然是中文版),文件名和文件内容等编码都是gbk,而我们在开发过程中,IDE里的编码则是UTF-8,(这里不讨论为什么等等问题,只考虑怎么把编码转变成一样的)所以导致我写的UTF-8编码的正则模式字符串中的中文在gbk编码的文件中并不能正确匹配。

一开始,我并没有什么办法,试过把PHP脚本文件的编码也改成GBK,也可以用,但是想到这种方法太low了,所以找一找PHP中有没有函数可以满足我的需求。

这时,我想到了以前在处理windows中的文件名时用的函数iconv(),其函数原型如下:

stringiconv(string$in_charset,string$out_charset,string$str)

Performsacharactersetconversiononthestringstrfromin_charsettoout_charset.

我们常使用:

$out_charset='utf-8';

$fileName=iconv($fileName,$out_charset,'gbk');

来处理文件名,将文件名改从gbk改为UTF-8而内容不变。

手册翻译附加:

  • 如果你在输出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能转换为UTF-8的字符时,程序会自动替换为一个相似字符的UTF-8字符;
  • 如果你在输出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能转换为UTF-8的字符时,程序会自动跳过这个字符。
  • 如果你什么都没加,就在遇到不能替换成UTF-8的字符时,替换会被中断。

但是,我在用这个函数处理时,结果却是这样:

详解PHP用mb_string处理windows中文字符

意思是iconv()函数能处理的最大字符数只有64,一般的文件名大小,而我的文件内容很显然不止64个字符。

没有办法,我只好再次各种翻找别的函数。

直到我发现了mb_string函数库,这个函数库一般都在PHP环境里集成,我们可以在phpinfo()里找到它。

详解PHP用mb_string处理windows中文字符

mb_string函数里有一个mb_convert_encoding()函数,可以将一个字符串的编码改变,其函数原型如下:

stringmb_convert_encoding(string$str,string$to_encoding[,mixed$from_encoding])

Convertsthecharacterencodingofstringstrtoto_encodingfromoptionallyfrom_encoding.

基原型跟iconv()函数差不多,只是它没有对输出函数的后缀修饰,它也没有对字符串长度的明确限制。

而且我们看到$from_encoding是可选的,它可以自动识别源编码。

因为找不到一个确切的无法转码的字符,也不知道它遇到无法转码的字符会怎么处理。

通过mb_convert_encoding()函数,将整个文件处理了一下,于是,问题顺利解决。

最后介绍一下mb_string函数库,它全名叫MultibyteString,它的很多方法都扩展自PHP自身的string函数库,函数名在原函数的前面加了"mb_",这些函数除了拥有原函数的作用外,还在可选参数的最后加入了一个$encoding的可选参数,这个参数可以规定函数以什么样的编码方式来处理字符串。

例如strpos()函数,找到一个字符串在另一个字符串中的位置。

strpos("欢迎来访问","问",0)返回的结果是12,因为脚本是UTF-8编码,而将字符串转为UTF-8编码后,每个中文字符会占用3个字节。

而在mb_strpos()函数中,mb_strpos("欢迎来访问","问",0,'utf-8')则会返回4,它会将字符串当作已经转UTF-8的状态执行。

而mb_strpos("欢迎来访问","问",0,'gbk')会返回6

以上就是详解PHP用mb_string处理windows中文字符的详细内容,更多关于PHP用mb_string处理windows中文字符的资料请关注三水点靠木其它相关文章!

PHP 相关文章推荐
繁体中文转换为简体中文的PHP函数
Oct 09 PHP
怎样在PHP中通过ADO调用Asscess数据库和COM程序
Oct 09 PHP
PHP设计模式之调解者模式的深入解析
Jun 13 PHP
PHP加密函数 Javascript/Js 解密函数
Sep 23 PHP
php快递单号查询接口使用示例
May 05 PHP
跟我学Laravel之请求与输入
Oct 15 PHP
php实现redis数据库指定库号迁移的方法
Jan 14 PHP
PHP学习笔记(一):基本语法之标记、空白、和注释
Apr 17 PHP
Zend Framework教程之Zend_Config_Xml用法分析
Mar 23 PHP
PHP+Redis开发的书签案例实战详解
Jul 09 PHP
PHP检测一个数组有没有定义的方法步骤
Jul 20 PHP
php让json_encode不自动转义斜杠“/”的方法
Apr 27 PHP
详解PHP服务器如何在有限的资源里最大提升并发能力
详解PHP设计模式之依赖注入模式
阿里云服务器搭建Php+Apache运行环境的详细过程
php+laravel 扫码二维码签到功能
你真的了解PHP中的引用符号(&)吗
php中配置文件保存修改操作 如config.php文件的读取修改等操作
May 12 #PHP
php7中停止php-fpm服务的方法详解
May 09 #PHP
You might like
PHPWind 发帖回帖Api PHP版打包下载
2010/02/08 PHP
php过滤敏感词的示例
2014/03/31 PHP
浅谈PHP正则表达式中修饰符/i, /is, /s, /isU
2014/10/21 PHP
phpstudy默认不支持64位php的解决方法
2017/02/20 PHP
yii2.0框架使用 beforeAction 防非法登陆的方法分析
2019/09/11 PHP
用js获取电脑信息(是使用与IE浏览器)
2013/01/15 Javascript
js图片延迟技术一般的思路与示例
2014/03/20 Javascript
js封装可使用的构造函数继承用法分析
2015/01/28 Javascript
详解JavaScript中的every()方法
2015/06/08 Javascript
[原创]JQuery 在表单提交之前修改 提交的值
2016/04/14 Javascript
原生JS实现风箱式demo,并封装了一个运动框架(实例代码)
2016/07/22 Javascript
JS简单设置下拉选择框默认值的方法
2016/08/20 Javascript
js前端实现多图图片上传预览的两个方法(推荐)
2016/11/18 Javascript
jQuery验证表单格式的使用方法
2017/01/10 Javascript
vue移动端实现红包雨效果
2020/06/23 Javascript
nodejs微信开发之授权登录+获取用户信息
2019/03/17 NodeJs
vue中使用vue-pdf的方法详解
2020/09/05 Javascript
[40:03]DOTA2上海特级锦标赛主赛事日 - 1 败者组第一轮#1EHOME VS Archon
2016/03/02 DOTA
在DigitalOcean的服务器上部署flaskblog应用
2015/12/19 Python
Opencv+Python 色彩通道拆分及合并的示例
2018/12/08 Python
对pytorch网络层结构的数组化详解
2018/12/08 Python
python求最大值,不使用内置函数的实现方法
2019/07/09 Python
python basemap 画出经纬度并标定的实例
2019/07/09 Python
详解python实现交叉验证法与留出法
2019/07/11 Python
Pytorch中的variable, tensor与numpy相互转化的方法
2019/10/10 Python
Python3以GitHub为例来实现模拟登录和爬取的实例讲解
2020/07/30 Python
CSS3教程(2):网页边框半径和网页圆角
2009/04/02 HTML / CSS
HTML5地理定位与第三方工具百度地图的应用
2016/11/17 HTML / CSS
戴尔美国官网:Dell
2016/08/31 全球购物
NYX Professional Makeup俄罗斯官网:世界知名的化妆品品牌
2019/12/26 全球购物
优秀护士演讲稿
2014/04/30 职场文书
党员干部形式主义个人整改措施
2014/09/17 职场文书
2014市府办领导班子“四风问题”对照检查材料思想汇报
2014/09/24 职场文书
党员进社区活动总结
2015/05/07 职场文书
教师节班会开场白
2015/06/01 职场文书
python playwright之元素定位示例详解
2022/07/23 Python