PHP用mb_string函数库处理与windows相关中文字符及Win环境下开启PHP Mb_String方法


Posted in PHP onNovember 11, 2015

PHP用mb_string函数库处理与windows相关中文字符

昨天想批处理以前下载的一堆文件,把文件里的关键内容用正则匹配出来,集中处理。在操作文件时遇到一个问题,就是windows操作系统中的编码问题。

我们都知道windows中(当然是中文版),文件名和文件内容等编码都是gbk,而我们在开发过程中,IDE里的编码则是UTF-8,(这里不讨论为什么等等问题,

只考虑怎么把编码转变成一样的)所以导致我写的UTF-8编码的正则模式字符串中的中文在gbk编码的文件中并不能正确匹配。

一开始,我并没有什么办法,试过把PHP脚本文件的编码也改成GBK,也可以用,但是想到这种方法太low了,所以找一找PHP中有没有函数可以满足我的需求。

这时,我想到了以前在处理windows中的文件名时用的函数iconv(),其函数原型如下:

string iconv ( string $in_charset , string $out_charset , string $str )
Performs a character set conversion on the string str from in_charset to out_charset.

我们常使用:

$out_charset='utf-8';
$fileName=iconv($fileName,$out_charset,'gbk');

来处理文件名,将文件名改从gbk改为UTF-8而内容不变。

手册翻译附加:

如果你在输出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能转换为UTF-8的字符时,程序会自动替换为一个相似字符的UTF-8字符;

如果你在输出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能转换为UTF-8的字符时,程序会自动跳过这个字符。

如果你什么都没加,就在遇到不能替换成UTF-8的字符时,替换会被中断。
但是,我在用这个函数处理时,结果却是这样:

PHP用mb_string函数库处理与windows相关中文字符及Win环境下开启PHP Mb_String方法

意思是iconv()函数能处理的最大字符数只有64,一般的文件名大小,而我的文件内容很显然不止64个字符。

没有办法,我只好再次各种翻找别的函数。

直到我发现了mb_string函数库,这个函数库一般都在PHP环境里集成,我们可以在phpinfo()里找到它。

PHP用mb_string函数库处理与windows相关中文字符及Win环境下开启PHP Mb_String方法

mb_string函数里有一个mb_convert_encoding()函数,可以将一个字符串的编码改变,其函数原型如下:

string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
Converts the character encoding of string str to to_encoding from optionally from_encoding.

基原型跟iconv()函数差不多,只是它没有对输出函数的后缀修饰,它也没有对字符串长度的明确限制。

而且我们看到$from_encoding是可选的,它可以自动识别源编码。

因为找不到一个确切的无法转码的字符,也不知道它遇到无法转码的字符会怎么处理。

通过mb_convert_encoding()函数,将整个文件处理了一下,于是,问题顺利解决。

最后介绍一下mb_string函数库,它全名叫Multibyte String,它的很多方法都扩展自PHP自身的string函数库,函数名在原函数的前面加了"mb_",这些函数除了拥有原函数的作用外,还在可选参数的最后加入了一个$encoding的可选参数,这个参数可以规定函数以什么样的编码方式来处理字符串。

例如strpos()函数,找到一个字符串在另一个字符串中的位置。

strpos("欢迎来访问","问",0)返回的结果是12,因为脚本是UTF-8编码,而将字符串转为UTF-8编码后,每个中文字符会占用3个字节。

而在mb_strpos()函数中,mb_strpos("欢迎来访问","问",0,'utf-8')则会返回4,它会将字符串当作已经转UTF-8的状态执行。

而mb_strpos("欢迎来访问","问",0,'gbk')会返回6

当然,它还有更多有特色的地方~

下面给大家介绍Windows环境下开启PHP Mb_String方法

前几天跑一个Php程序,需要转字符编码,可是一探服务器,居然说不支持Mb_String扩展。我查了Php的扩展库里是有php_mbstring.dll这个文件的。

下面将打开的方法告诉大家

1.确保你的Windows/system32下有php_mbstring.dll这个文件,没有就从你Php安装目录extensions里拷入Windows/system32里面。

2.在windows目录下找到php.ini打开编辑,搜索mbstring.dll,找到
;extension=php_mbstring.dll

然后将前面的;号去掉,打开对组件的支持

3.重启PHP服务(如果不会你可重新启一下计算机)

4.完成

PHP 相关文章推荐
PHP 字符串编码截取函数(兼容utf-8和gb2312)
May 02 PHP
php面向对象全攻略 (四)构造方法与析构方法
Sep 30 PHP
比较全面的PHP数组的使用方法小结
Sep 23 PHP
浅析PHP页面局部刷新功能的实现小结
Jun 21 PHP
php中__destruct与register_shutdown_function执行的先后顺序问题
Oct 17 PHP
PHP遍历目录函数opendir()、readdir()、closedir()、rewinddir()总结
Nov 18 PHP
php中heredoc与nowdoc介绍
Dec 25 PHP
php基于GD库画五星红旗的方法
Feb 24 PHP
php通过array_unshift函数添加多个变量到数组前端的方法
Mar 18 PHP
Smarty实现页面静态化(生成HTML)的方法
May 23 PHP
thinkphp查询,3.X 5.0方法(亲试可行)
Jun 17 PHP
关于laravel-admin ueditor 集成并解决刷新的问题
Oct 21 PHP
深入php内核之php in array
Nov 10 #PHP
谈谈你对Zend SAPIs(Zend SAPI Internals)的理解
Nov 10 #PHP
php实现可运算的验证码
Nov 10 #PHP
如何使用PHP Embed SAPI实现Opcodes查看器
Nov 10 #PHP
深入理解PHP内核(二)之SAPI探究
Nov 10 #PHP
深入理解PHP内核(一)
Nov 10 #PHP
在PHP中使用FastCGI解析漏洞及修复方案
Nov 10 #PHP
You might like
十天学会php之第六天
2006/10/09 PHP
Zend Framework 2.0事件管理器(The EventManager)入门教程
2014/08/11 PHP
php中动态修改ini配置
2014/10/14 PHP
使用PHP生成图片的缩略图的方法
2015/08/18 PHP
php对文件夹进行相关操作(遍历、计算大小)
2015/11/04 PHP
如何用js控制css中的float的代码
2007/08/16 Javascript
javascript 正则替换 replace(regExp, function)用法
2010/05/22 Javascript
通过JavaScript控制字体大小的代码
2011/10/04 Javascript
解析js如何获取当前url中的参数值并复制给input
2013/06/23 Javascript
jquery mobile实现拨打电话功能的几种方法
2013/08/05 Javascript
jQuery插件windowScroll实现单屏滚动特效
2015/07/14 Javascript
javascript中setTimeout使用指南
2015/07/26 Javascript
js实现点击获取验证码倒计时效果
2021/01/28 Javascript
Node.js开发者必须了解的4个JS要点
2016/02/21 Javascript
深入解析桶排序算法及Node.js上JavaScript的代码实现
2016/07/06 Javascript
JS实现将数字金额转换为大写人民币汉字的方法
2016/08/02 Javascript
老生常谈ES6中的类
2017/07/31 Javascript
nodejs实现截取上传视频中一帧作为预览图片
2017/12/10 NodeJs
微信小程序使用radio显示单选项功能【附源码下载】
2017/12/11 Javascript
基于Bootstrap和JQuery实现动态打开和关闭tab页的实例代码
2019/06/10 jQuery
JS实现利用闭包判断Dom元素和滚动条的方向示例
2019/08/26 Javascript
Javascript如何实现扩充基本类型
2020/08/26 Javascript
Nuxt.js 静态资源和打包的操作
2020/11/06 Javascript
vue-quill-editor插入图片路径太长问题解决方法
2021/01/08 Vue.js
[02:27]2018DOTA2亚洲邀请赛赛前采访-OpTic
2018/04/03 DOTA
python增加矩阵维度的实例讲解
2018/04/04 Python
对python requests的content和text方法的区别详解
2018/10/11 Python
Python类的继承、多态及获取对象信息操作详解
2019/02/28 Python
pyqt5 从本地选择图片 并显示在label上的实例
2019/06/13 Python
flask 实现token机制的示例代码
2019/11/07 Python
Lacoste澳大利亚官网:服装、鞋类及配饰
2018/11/14 全球购物
波兰在线杂货店:Polski Koszyk
2019/11/02 全球购物
医学专业五年以上个人求职信
2013/12/03 职场文书
大学毕业生通用自我评价
2014/01/05 职场文书
ORACLE数据库应用开发的三十个注意事项
2021/06/07 Oracle
python前后端自定义分页器
2022/04/13 Python