php导入csv文件碰到乱码问题的解决方法


Posted in PHP onFebruary 10, 2014

今天主要是想写一个php导入csv文件的方法,其实网上一搜一大把。都是可以实现怎么去导入的。但是我导入的时候遇到了两个问题,一个是在windows上写代码的时候测试发生了乱码问题,然后解决了。第二个是提交到linux系统上的时候又发生了乱码。我开始还不清楚是乱码的原因,一开始我还以为是代码svn提交发生的错误,到最后我在我的一个群里提问了一下,一朋友是做phpcms的,他说他遇到从Windows提交到Linux的时候刚开始也总是发生错误,后来排查原因就是乱码导致成的。下面切入正题看怎么解决两个问题的吧!

问题一解决:

php读取csv文件,在windows上出现中文读取不到的情况,本人立马想到一个函数mb_convert_encoding();作如下设置 $str = mb_convert_encoding($str, "UTF-8", "GBK");然后就可以了。当然你也可以用iconv();作如下设置iconv(‘GBK',”UTF-8//TRANSLIT//IGNORE”,$str);这两个函数来解决在windows上面发生乱码的问题。

问题二解决:

php读取csv文件,在linux上出现中文读取不到的情况,百度,google后找到解决办法

就是添加了一行代码setlocale(LC_ALL, 'zh_CN');对,亮瞎你的眼了吧。就这么简单,如果你不知道,可能会花很多时间去解决这个问题。
PHP setlocale() 函数解释
定义和用法

setlocale() 函数设置地区信息(地域信息)。

地区信息是针对一个地理区域的语言、货币、时间以及其他信息。该函数返回当前的地区设置,若失败则返回 false。
以下是在资料上收集常用的地区标识:

zh_CN GB2312 
en_US.UTF-8 UTF-8 
zh_TW BIG5 
zh_HK BIG5-HKSCS 
zh_TW.EUC-TW EUC-TW 
zh_TW.UTF-8 UTF-8 
zh_HK.UTF-8 UTF-8 
zh_CN.GBK GBK

例如、
utf-8: setlocale(LC_ALL, ‘en_US.UTF-8′);
简体:setlocale(LC_ALL, ‘zh_CN');

之所以给大家讲 setlocale()这个函数,是因为我导入csv文件到linux系统的时候发生了乱码,包括用了mb_convert_encoding()和iconv()两个函数都是没搞定最后问题的。最后就加了这一句setlocale(LC_ALL, ‘zh_CN');加在导入csv文件开始的代码前面就轻松搞定了,然后我又找了一下资料,发现fgetcsv()函数对区域设置是敏感的。比如说 LANG 设为 en_US.UTF-8 的话,单字节编码的文件就会出现读取错误,所以我们需要对其进行区域性的设置。特分享给大家。

我还尝试用了以下代码也没能搞定,这些都是生成csv文件的header的设置。可能在我这里不起作用,但是在你那里也说不定哦。所以我都整理出来,尽可能的帮助遇到导入csv文件乱码的同行,因为在没办法的情况下真的太难处理了。大家可以都试试!总有一个是属于你的。

<?php 
$csvContent="csvzero,csvone,csvtwo,csvthree,csvfour,csvfive"; 
header("Content-Type: application/vnd.ms-excel; charset=GB2312"); 
header("Pragma: public"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("Content-Type: application/force-download"); 
header("Content-Type: application/octet-stream"); 
header("Content-Type: application/download"); 
header("Content-Disposition: attachment;filename=CSV数据.csv "); 
header("Content-Transfer-Encoding: binary "); 
$csvContent = iconv("utf-8","gb2312",$csvContent); 
echo $csvContent; 
exit; 
?>

下面就再来具体看看php导入csv文件的代码:

两个函数简单介绍一下,

mb_detect_encoding()检测到的字符编码,或者无法检测指定字符串的编码时返回FALSE。

fgetcsv() 函数从文件指针中读入一行并解析 CSV 字段。与fgets() 类似,不同的是 fgetcsv() 解析读入的行并找出 CSV 格式的字段,然后返回一个包含这些字段的数组。fgetcsv() 出错时返回 FALSE,包括碰到文件结束时。

注释:从 PHP 4.3.5 起,fgetcsv() 的操作是二进制安全的。

注释:CSV 文件中的空行将被返回为一个包含有单个 null 字段的数组,不会被当成错误。

注释:该函数对区域设置是敏感的。比如说 LANG 设为 en_US.UTF-8 的话,单字节编码的文件就会出现读取错误。

注释:如果碰到 PHP 在读取文件时不能识别 Macintosh 文件的行结束符,可以激活 auto_detect_line_endings 运行时配置选项。

<?php 
setlocale(LC_ALL, 'zh_CN'); //设置地区信息(地域信息) 
$file = $_FILES['files']; 
$file_type = substr(strstr($file['name'],'.'),1); 
if ($file_type != 'csv'){ 
echo "<script type=\"text/javascript\">alert(\"文件格式错误,请重新上传!\"); </script>"; 
exit; 
} 
$handle = fopen($file['tmp_name'],"r"); 
$file_encoding = mb_detect_encoding($handle); 
if ($file_encoding != 'ASCII'){ 
echo "<script type=\"text/javascript\">alert(\"文件编码错误,请重新上传!\"); </script>"; 
exit; 
} 
$row = 0; 
$str=""; 
$sy=""; 
while ($data = fgetcsv($handle,1000,',')){ 
$row++; 
if ($row == 0) 
continue; 
$num = count($data); 
for ($i=0; $i<$num; $i++){ 
$str = (string)$data[$i].'|'; 
$str = mb_convert_encoding($str, "UTF-8", "GBK"); //已知源码为GBK,转换为utf-8 
$sy .= $str; //我这里做的比较复杂,是用'|'将csv文件里面的内容用'|'全部拼起来,因为我导入的是商品信息,需要根据用户需 
//要导入的数据去定义哪些数据是需要导入的。 
} 
} 
if ($sy) { $sy = rtrim($sy, '|'); } 
$arr = explode('|',$sy); 
$key = array_slice($arr,0,$num); //这个数组就是csv文件里面标题,就是商品id,标题,卖点等等的数据 
$skey = array(); 
$length = array(); 
$co = count($arr); 
$p = $co/$num; //求出要取出的数据的长度 
for($j=0;$j<$p;$j++){ 
$offset=($j-1)*$num; //偏移量,就像分页一样,我这里根据偏移量取出的一个数组就是一个商品的信息。 
if($j==0){ 
$length[] = array_slice($arr,0,$num); 
}else{ 
$length[] = array_slice($arr,$num+$offset,$num);//取出有哪些字段和商品 
} 
} 
$arrtitle = array(); 
$arrfileds = array(); 
$arrtagname = DB::select('字段标识', '字段名称')->from('字段表')->fetch_all(); 
foreach ($arrtagname as $value) { 
$arrfileds[$value['fileds_tags']] = $value['fileds_name']; 
} 
foreach ($fileds as $v) 
{ 
$temarr= explode('-', $v); 
if (isset($temarr[0]) && !empty($temarr[0])) { 
if (isset($temarr[1]) && !empty($temarr[1])) { 
if ($temarr[1] == 'wenben') { 
$arrtitle[] = $arrfileds[$temarr[0]].'文本'; 
} 
} else { 
if ($temarr[0] != 'pic') { //是取出字段是图片就给去掉 
$arrtitle[] = $arrfileds[$temarr[0]]; 
} 
} 
} } 
$skey = array(); 
$order = array(); 
$order[] = 'act_tag'; 
$order[] = 'channel_tag'; 
$order[] = 'created_time'; 
$order[] = 'orderby'; 
$rows =''; 
$f = $co/$num;//求出有多少件商品 
for($p=0;$p<count($arrtitle);$p++){ 
//这里就是根据自己的需求查出自己需要的数据,通过用户需要的商品字段标识查出表里相对应的英文标识。 
$skey[]= DB::select('字段标识')->from('字段表')->where('字段名称', '=', $arrtitle[$p])->fetch_row(); 
$rows .= $skey[$p]['字段标识'].'|'; 
} 
if($rows){ $rows = rtrim($rows,'|'); } 
if(!empty($rows)){ $exrows = explode('|',$rows); }else{ $exrows = array(); } 
$skeys = array_merge($order,$exrows); 
$count1 = count($skeys); //字段的个数 
if(!empty($length)){ 
for($x=1;$x<$f;$x++){ //求出有多少件商品就的循环多少次 
$orders = array(); 
$orders[] = $act_tag; 
$orders[] = $channel_tag; 
$orders[] = time(); 
$newlen = array_merge($orders,$length[$x]); 
if($count1 !== count($newlen)){ //如果商品字段的长度和商品的长度不等就证明用户有哪个字段没录入 
$newrs = array(); 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".'请检查第,'.($x-1).'件商品!'.'导入失败!'."</font>"); </script>"; 
fclose($handle); 
exit(); 
}else{ //start 
$arrimport = array_combine($skeys,$newlen); //如果两个数组是相等的我就合并数组,并把导入csv里面的日期改为时间戳存储到数据库 
if(!empty($arrimport['start_time'])){ $sta = strtotime($arrimport['start_time']); }else{ $sta=(int)0; } 
if(!empty($arrimport['end_time'])){ $end = strtotime($arrimport['end_time']); }else{ $end=(int)0; } 
$arrtime=array('start_time'=>$sta,'end_time'=>$end); 
if(!empty($arrimport['start_time']) && !empty($arrimport['end_time'])){ 
$newrs=array_merge($arrimport,$arrtime); 
}else{ 
$newrs = array(); 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".'请检查第,'.($x-1).'件商品!'.'导入失败!'."</font>"); </script>"; 
fclose($handle); 
exit(); 
} 
if(count($skeys) == count($newrs)){ 
DB::insert('商品表', array_values($skeys)) 
->values(array_values($newrs)) 
->execute(); 
} 
} //end 
} 
} 
if($row-1==(int)0){ 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".'您导入的商品为空!'."</font>"); </script>"; 
}else{ 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".'成功导入'."<font color=#f00;>".($row-1)."</font>".'件商品!'."</font>"); 
} 
fclose($handle); 
} 
?>

以上是我工作需要所做的csv导入处理,可能和你的导入方式不同,但是部分代码总会对你有帮助!
以下是简单导入:
<form enctype="multipart/form-data" action="import.php" method="POST"> 
导入模板 
<label for="文件选择">文件选择:</label><input name="csv_goods" type="file" /> 
<input type="submit" value="导入" name="import" /> 
</form> 
<?php 
if (isset($_POST['import'])){ $file = $_FILES['csv_goods']; 
$file_type = substr(strstr($file['name'],'.'),1); 
// 检查文件格式 
if ($file_type != 'csv'){ 
echo '文件格式不对,请重新上传!'; 
exit; 
} 
$handle = fopen($file['tmp_name'],"r"); 
$file_encoding = mb_detect_encoding($handle); 
// 检查文件编码 
if ($file_encoding != 'ASCII'){ 
echo '文件编码错误,请重新上传!'; 
exit; 
} 
$row = 0; 
while ($data = fgetcsv($handle,1000,',')){ 
//echo "<font color=red>$row</font>"; //可以知道总共有多少行 
$row++; 
if ($row == 1) 
continue; 
$num = count($data); 
// 这里会依次输出每行当中每个单元格的数据 
for ($i=0; $i<$num; $i++){ 
echo $data[$i]."<br>"; 
// 在这里对数据进行处理 
} 
} 
fclose($handle); 
} 
?>
PHP 相关文章推荐
php,ajax实现分页
Mar 27 PHP
ie6 动态缩略图不显示的原因
Jun 21 PHP
PHP对象转换为数组函数(递归方法)
Feb 04 PHP
关于ob_get_contents(),ob_end_clean(),ob_start(),的具体用法详解
Jun 24 PHP
php插入排序法实现数组排序实例
Feb 16 PHP
Yii2中使用join、joinwith多表关联查询
Jun 30 PHP
Thinkphp框架开发移动端接口(2)
Aug 18 PHP
浅谈PHP的反射API
Feb 26 PHP
php实现 master-worker 守护多进程模式的实例代码
Jul 20 PHP
Laravel 使用查询构造器配合原生sql语句查询的例子
Oct 12 PHP
php去除数组中为0的元素的实例分析
Nov 17 PHP
微信小程序结合ThinkPHP5授权登陆后获取手机号
Nov 23 PHP
php判断正常访问和外部访问的示例
Feb 10 #PHP
php利用单例模式实现日志处理类库
Feb 10 #PHP
PHP遍历并打印指定目录下所有文件实例
Feb 10 #PHP
php生成excel文件的简单方法
Feb 08 #PHP
php中利用explode函数分割字符串到数组
Feb 08 #PHP
PHP判断变量是否为0的方法
Feb 08 #PHP
php读取文件内容的三种可行方法示例介绍
Feb 08 #PHP
You might like
请离开include_once和require_once
2013/07/18 PHP
详解php设置session(过期、失效、有效期)
2015/11/12 PHP
Twig模板引擎用法入门教程
2016/01/20 PHP
PHP常用的三种设计模式汇总
2016/08/28 PHP
laravel dingo API返回自定义错误信息的实例
2019/09/29 PHP
基于jquery的获取mouse坐标插件的实现代码
2010/04/01 Javascript
js利用与或运算符优先级实现if else条件判断表达式
2010/04/15 Javascript
获取body标签的两种方法
2011/10/13 Javascript
jquery模拟SELECT下拉框取值效果
2013/10/23 Javascript
js写出遮罩层登陆框和对联广告并自动跟随滚动条滚动
2014/04/29 Javascript
jQuery响应鼠标事件并隐藏与显示input默认值
2014/08/24 Javascript
jQuery制作简单柱状图实例
2015/01/28 Javascript
jQuery+HTML5加入购物车代码分享
2020/10/29 Javascript
分享五个有用的jquery小技巧
2015/10/08 Javascript
JS组件系列之Bootstrap Icon图标选择组件
2016/01/28 Javascript
JavaScript基于面向对象实现的猜拳游戏
2018/01/03 Javascript
react-native android状态栏的实现
2018/06/15 Javascript
angular4自定义表单控件[(ngModel)]的实现
2018/11/23 Javascript
JavaScript内置对象math,global功能与用法实例分析
2019/06/10 Javascript
Javascript数组方法reduce的妙用之处分享
2019/06/10 Javascript
python实现在目录中查找指定文件的方法
2014/11/11 Python
Djang中静态文件配置方法
2015/07/30 Python
使用Python保存网页上的图片或者保存页面为截图
2016/03/05 Python
Python实现发送QQ邮件的封装
2017/07/14 Python
Python进阶之尾递归的用法实例
2018/01/31 Python
Python统计单词出现的次数
2018/04/04 Python
Python实现图片拼接的代码
2018/07/02 Python
matplotlib jupyter notebook 图像可视化 plt show操作
2020/04/24 Python
国际知名军事风格休闲装品牌:Alpha Industries(阿尔法工业)
2017/05/24 全球购物
俄罗斯儿童和青少年服装、鞋子及配件的在线商店:Orby
2020/02/20 全球购物
夜大毕业生自我鉴定
2013/10/31 职场文书
婚礼司仪主持词
2014/03/14 职场文书
乡镇党建工作汇报材料
2014/10/27 职场文书
采购员岗位职责范本
2015/04/07 职场文书
民间借贷借条如何写
2015/05/26 职场文书
Linux安装Docker详细教程
2022/07/07 Servers