详解PHP用mb_string处理windows中文字符


Posted in PHP onMay 26, 2021

我们都知道windows中(当然是中文版),文件名和文件内容等编码都是gbk,而我们在开发过程中,IDE里的编码则是UTF-8,(这里不讨论为什么等等问题,只考虑怎么把编码转变成一样的)所以导致我写的UTF-8编码的正则模式字符串中的中文在gbk编码的文件中并不能正确匹配。

一开始,我并没有什么办法,试过把PHP脚本文件的编码也改成GBK,也可以用,但是想到这种方法太low了,所以找一找PHP中有没有函数可以满足我的需求。

这时,我想到了以前在处理windows中的文件名时用的函数iconv(),其函数原型如下:

stringiconv(string$in_charset,string$out_charset,string$str)

Performsacharactersetconversiononthestringstrfromin_charsettoout_charset.

我们常使用:

$out_charset='utf-8';

$fileName=iconv($fileName,$out_charset,'gbk');

来处理文件名,将文件名改从gbk改为UTF-8而内容不变。

手册翻译附加:

  • 如果你在输出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能转换为UTF-8的字符时,程序会自动替换为一个相似字符的UTF-8字符;
  • 如果你在输出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能转换为UTF-8的字符时,程序会自动跳过这个字符。
  • 如果你什么都没加,就在遇到不能替换成UTF-8的字符时,替换会被中断。

但是,我在用这个函数处理时,结果却是这样:

详解PHP用mb_string处理windows中文字符

意思是iconv()函数能处理的最大字符数只有64,一般的文件名大小,而我的文件内容很显然不止64个字符。

没有办法,我只好再次各种翻找别的函数。

直到我发现了mb_string函数库,这个函数库一般都在PHP环境里集成,我们可以在phpinfo()里找到它。

详解PHP用mb_string处理windows中文字符

mb_string函数里有一个mb_convert_encoding()函数,可以将一个字符串的编码改变,其函数原型如下:

stringmb_convert_encoding(string$str,string$to_encoding[,mixed$from_encoding])

Convertsthecharacterencodingofstringstrtoto_encodingfromoptionallyfrom_encoding.

基原型跟iconv()函数差不多,只是它没有对输出函数的后缀修饰,它也没有对字符串长度的明确限制。

而且我们看到$from_encoding是可选的,它可以自动识别源编码。

因为找不到一个确切的无法转码的字符,也不知道它遇到无法转码的字符会怎么处理。

通过mb_convert_encoding()函数,将整个文件处理了一下,于是,问题顺利解决。

最后介绍一下mb_string函数库,它全名叫MultibyteString,它的很多方法都扩展自PHP自身的string函数库,函数名在原函数的前面加了"mb_",这些函数除了拥有原函数的作用外,还在可选参数的最后加入了一个$encoding的可选参数,这个参数可以规定函数以什么样的编码方式来处理字符串。

例如strpos()函数,找到一个字符串在另一个字符串中的位置。

strpos("欢迎来访问","问",0)返回的结果是12,因为脚本是UTF-8编码,而将字符串转为UTF-8编码后,每个中文字符会占用3个字节。

而在mb_strpos()函数中,mb_strpos("欢迎来访问","问",0,'utf-8')则会返回4,它会将字符串当作已经转UTF-8的状态执行。

而mb_strpos("欢迎来访问","问",0,'gbk')会返回6

以上就是详解PHP用mb_string处理windows中文字符的详细内容,更多关于PHP用mb_string处理windows中文字符的资料请关注三水点靠木其它相关文章!

PHP 相关文章推荐
随机头像PHP版
Oct 09 PHP
PHP入门学习的几个不错的实例代码
Jul 13 PHP
PHP 巧用数组降低程序的时间复杂度
Jan 01 PHP
linux环境apache多端口配置虚拟主机的方法深入介绍
Jun 09 PHP
php读取富文本的时p标签会出现红线是怎么回事
May 13 PHP
Yii结合CKEditor实现图片上传功能
Jun 13 PHP
php+mysqli数据库连接的两种方式
Jan 28 PHP
PHP制作百度词典查词采集器
Jan 29 PHP
php中动态变量用法实例
Jun 10 PHP
php fread读取文件注意事项
Sep 24 PHP
PHP关于foreach复制知识点总结
Jan 28 PHP
php+mysql开发中的经验与常识小结
Mar 25 PHP
详解PHP服务器如何在有限的资源里最大提升并发能力
详解PHP设计模式之依赖注入模式
阿里云服务器搭建Php+Apache运行环境的详细过程
php+laravel 扫码二维码签到功能
你真的了解PHP中的引用符号(&)吗
php中配置文件保存修改操作 如config.php文件的读取修改等操作
May 12 #PHP
php7中停止php-fpm服务的方法详解
May 09 #PHP
You might like
php md5下16位和32位的实现代码
2008/04/09 PHP
有关PHP中MVC的开发经验分享
2012/05/17 PHP
zf框架的校验器InArray使用示例
2014/03/13 PHP
php compact 通过变量创建数组
2016/11/15 PHP
PHP设计模式之原型设计模式原理与用法分析
2018/04/25 PHP
JQuery each()函数如何优化循环DOM结构的性能
2012/12/10 Javascript
JS循环遍历JSON数据的方法
2014/07/08 Javascript
js使用DOM操作实现简单留言板的方法
2015/04/10 Javascript
JavaScript事件委托实例分析
2015/05/26 Javascript
JavaScript基于ajax编辑信息用法实例
2015/07/15 Javascript
javascript中offset、client、scroll的属性总结
2015/08/13 Javascript
JSONObject使用方法详解
2015/12/17 Javascript
javascript使用闭包模拟对象的私有属性和方法
2016/10/05 Javascript
jquery获取点击控件的绝对位置简单实例
2016/10/13 Javascript
ES6中的箭头函数实例详解
2017/04/06 Javascript
NodeJS使用七牛云存储上传文件的方法
2017/07/24 NodeJs
ES6中Array.includes()函数的用法
2017/09/20 Javascript
基于js 字符串indexof与search方法的区别(详解)
2017/12/04 Javascript
JavaScript运行原理分析
2018/02/09 Javascript
Layui数据表格之单元格编辑方式
2019/10/26 Javascript
package.json各个属性说明详解
2020/03/11 Javascript
微信小程序picker组件两列关联使用方式
2020/10/27 Javascript
python自制包并用pip免提交到pypi仅安装到本机【推荐】
2019/06/03 Python
Appium+python自动化怎么查看程序所占端口号和IP
2019/06/14 Python
python 字典 setdefault()和get()方法比较详解
2019/08/07 Python
Pytorch中index_select() 函数的实现理解
2019/11/19 Python
Python高阶函数、常用内置函数用法实例分析
2019/12/26 Python
细说NumPy数组的四种乘法的使用
2020/12/18 Python
施华洛世奇西班牙官网:SWAROVSKI西班牙
2019/06/06 全球购物
一个C/C++编程面试题
2013/11/10 面试题
统计员岗位职责
2013/11/14 职场文书
美德少年事迹材料
2014/01/23 职场文书
因工资原因离职的辞职信范文
2015/05/12 职场文书
2019餐饮行业创业计划书!
2019/06/27 职场文书
tree shaking对打包体积优化及作用
2022/07/07 Java/Android
Java Redisson多策略注解限流
2022/09/23 Java/Android