php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法


Posted in PHP onAugust 10, 2013

date.csv:
"ID" "NAME" "EMAIL"
"1" "小明" "xm@163.com"
"2" "小东" "xd@sina.com"
"3" "小少" "shaozi@hotmai.com"

读取这个csv文件

<?php
$handle=fopen('date.csv','r');
while($data=fgetcsv($handle,10000,"/t"))   
{   
  echo "$data[0]"."$data[1]"."$data[2]";   
}
?>

读取后在页面上显示时,成了这样:
"ID" NAME EMAIL
 1 小明 xm@163.com
 2 小东 xd@sina.com
 3 小少 shaozi@hotmai.com
fgetcsv函数的字段环绕符默认是双引号,
为什么我读取出来时,其它字段都好好的,可是ID还有双引号包着?

上网查了下,原来是utf8编码的bom在php下无法识别.
下面是查来的资料:
Unicode规范中有一个BOM的概念。BOM——Byte Order Mark,就是字节序标记。在
这里
找到一段关于BOM的说明:
在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。

另外unicode网站的
FAQ-BOM
详细介绍了BOM。官方的自然权威,不过是英文的,看起来比较费劲。
UTF-8编码的文件中,BOM占三个字节。如果用记事本把一个文本文件另存为UTF-8编码方式的话,用UE打开这个文件,切换到十六进制编辑状态就可以看到开头的FFFE了。这是个标识UTF-8编码文件的好办法,软件通过BOM来识别这个文件是否是UTF-8编码,很多软件还要求读入的文件必须带BOM。可是,还是有很多软件不能识别BOM。我在研究Firefox的时候就知道,在Firefox早期的版本里,扩展是不能有BOM的,不过Firefox 1.5以后的版本已经开始支持BOM了。现在又发现,PHP也不支持BOM。

PHP在设计时就没有考虑BOM的问题,也就是说他不会忽略UTF-8编码的文件开头BOM的那三个字符。由于必须在转换->UTF-8转ASCII,或者在另存为里选择ASCII编码。如果是DOS格式的行尾符,可以用记事本打开,点另存为,选ASCII编码。如果包含中文字符的话,可以用UE的另存为功能,选择“UTF-8 无 BOM”即可。请参考下面的图片:
php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法

根据Bo-Blog的wiki的说明:Editplus需要先另存为gb,再另存为UTF-8。不过这样做要小心,所有GBK编码中不包含的字符就会都丢了。如果有一些非中文的字符在文件里的话还是不要用这种办法了。(从这一个小方面来看,UE——UltraEdite-32确实比Editplus好很多,Editplus太轻量级了)

另外我发现了一个办法,就是利用Wordpress提供的文件编辑器。这个办法不受限制,不需要去下载专门的编辑器,毕竟大家都在用Wordpress嘛。先在ftp里把要编辑的文件的写入权限打开,然后进入Wordpress后台->管理->文件编辑器,输入要编辑文件的路径,点编辑文件。在显示出来的编辑界面中,你是看不到开头的那三个字符的,不过没关系,把光标定位在整个文件的第一个字符前,按一下Backspace键。OK了,点更新文件吧,在ftp里刷新一下,可以看到文件小了3字节,大功告成。

最后说一下,这是个大问题,所有要自己写插件的,编辑别人的插件自己用的,需要修改模版的(这条估计每个人都需要吧),最好了解一下上面的知识,免得出现问题时不知所措。

PHP 相关文章推荐
我的论坛源代码(六)
Oct 09 PHP
PHP伪静态页面函数附使用方法
Jun 20 PHP
php ajax 静态分页过程形式
Sep 02 PHP
PHP 代码规范小结
Mar 08 PHP
php中__destruct与register_shutdown_function执行的先后顺序问题
Oct 17 PHP
php防止网站被刷新的方法汇总
Dec 01 PHP
PHP函数checkdnsrr用法详解(Windows平台用法)
Mar 21 PHP
PHP实现bitmap位图排序与求交集的方法
Jul 28 PHP
利用PHP命令行模式采集股票趋势信息
Aug 09 PHP
PHP实现加密文本文件并限制特定页面的存取的效果
Oct 21 PHP
PHP操作Redis常用技巧总结
Apr 24 PHP
laravel 实现根据字段不同值做不同查询
Oct 23 PHP
浅析php中常量,变量的作用域和生存周期
Aug 10 #PHP
浅析linux下apache服务器的配置和管理
Aug 10 #PHP
本地机apache配置基于域名的虚拟主机详解
Aug 10 #PHP
php 删除目录下N分钟前创建的所有文件的实现代码
Aug 10 #PHP
php中如何判断一个网页请求是ajax请求还是普通请求
Aug 10 #PHP
php一些错误处理的方法与技巧总结
Aug 10 #PHP
Zend Studio 实用快捷键一览表(精心整理)
Aug 10 #PHP
You might like
PHP数据缓存技术
2007/02/14 PHP
PHP 加密/解密函数 dencrypt(动态密文,带压缩功能,支持中文)
2009/01/30 PHP
PHP 处理图片的类实现代码
2009/10/23 PHP
PHP中exec与system用法区别分析
2014/09/22 PHP
php调用自己java程序的方法详解
2016/05/13 PHP
浅谈Yii乐观锁的使用及原理
2017/07/25 PHP
漂亮的widgets,支持换肤和后期开发新皮肤(2007-4-27已更新1.7alpha)
2007/04/27 Javascript
javascript 获取select下拉列表值的代码
2009/09/07 Javascript
Javascript 刷新全集常用代码
2009/11/22 Javascript
js setTimeout opener的用法示例详解
2013/10/23 Javascript
编写高效jQuery代码的4个原则和5个技巧
2014/04/24 Javascript
js图片卷帘门导航菜单特效代码分享
2015/09/10 Javascript
Bootstrap面板使用方法
2017/01/16 Javascript
详解Angularjs在控制器(controller.js)中使用过滤器($filter)格式化日期/时间实例
2017/02/17 Javascript
JS设计模式之策略模式概念与用法分析
2018/02/05 Javascript
详解swiper在vue中的应用(以3.0为例)
2018/09/20 Javascript
js纯前端实现腾讯cos文件上传功能的示例代码
2019/05/14 Javascript
js防抖函数和节流函数使用场景和实现区别示例分析
2020/04/11 Javascript
JS获取一个字符串中指定字符串第n次出现的位置
2021/02/10 Javascript
Python获取Windows或Linux主机名称通用函数分享
2014/11/22 Python
怎样使用Python脚本日志功能
2016/08/14 Python
Python调用系统底层API播放wav文件的方法
2017/08/11 Python
Python寻找两个有序数组的中位数实例详解
2018/12/05 Python
python hbase读取数据发送kafka的方法
2018/12/27 Python
浅谈Pandas Series 和 Numpy array中的相同点
2019/06/28 Python
python实现修改固定模式的字符串内容操作示例
2019/12/30 Python
学python爬虫能做什么
2020/07/29 Python
python小技巧——将变量保存在本地及读取
2020/11/13 Python
女性时尚在线:IVRose
2019/02/23 全球购物
.net开发工程师面试题
2014/02/25 面试题
住房租房协议书
2014/08/20 职场文书
小学国旗下的演讲稿
2014/08/28 职场文书
立志成才演讲稿
2014/09/04 职场文书
2015年人力资源工作总结
2015/04/08 职场文书
老兵退伍感言
2015/08/03 职场文书
如何用JavaScript检测当前浏览器是无头浏览器
2021/04/27 Javascript