Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
基于Python实现的扫雷游戏实例代码
Aug 01 Python
实例解析Python设计模式编程之桥接模式的运用
Mar 02 Python
Python注释详解
Jun 01 Python
Python实现两个list求交集,并集,差集的方法示例
Aug 02 Python
关于Python作用域自学总结
Jun 10 Python
在Qt5和PyQt5中设置支持高分辨率屏幕自适应的方法
Jun 18 Python
Python Pandas中根据列的值选取多行数据
Jul 08 Python
Django 实现图片上传和显示过程详解
Jul 18 Python
Python 中 -m 的典型用法、原理解析与发展演变
Nov 11 Python
解决Django部署设置Debug=False时xadmin后台管理系统样式丢失
Apr 07 Python
Python request操作步骤及代码实例
Apr 13 Python
Python爬虫设置Cookie解决网站拦截并爬取蚂蚁短租的问题
Feb 22 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
PHP树的代码,可以嵌套任意层
2006/10/09 PHP
简单的方法让你的后台登录更加安全(php中加session验证)
2012/08/22 PHP
php 模拟POST提交的2种方法详解
2013/06/17 PHP
php使用filter过滤器验证邮箱 ipv6地址 url验证
2013/12/25 PHP
php计算两个日期相差天数的方法
2015/03/14 PHP
利用PHP抓取百度阅读的方法示例
2016/12/18 PHP
Mac系统完美安装PHP7详细教程
2017/06/06 PHP
Laravel中的chunk组块结果集处理与注意问题
2018/08/15 PHP
laravel ORM关联关系中的 with和whereHas用法
2019/10/16 PHP
一端时间轮换的广告
2006/06/26 Javascript
基于Asp.net与Javascript控制的日期控件
2010/05/22 Javascript
javascript中的注释使用与注意事项小结
2011/09/20 Javascript
javascript中attribute和property的区别详解
2014/06/05 Javascript
js实现window.open不被拦截的解决方法汇总
2014/10/30 Javascript
Javascript中拼接大量字符串的方法
2015/02/05 Javascript
JQuery给select添加/删除节点的实现代码
2016/04/26 Javascript
JS产生随机数的用法小结
2016/12/10 Javascript
js实现弹窗暗层效果
2017/01/16 Javascript
详解前后端分离之VueJS前端
2017/05/24 Javascript
Vue Cli3 创建项目的方法步骤
2018/10/15 Javascript
Python实现对excel文件列表值进行统计的方法
2015/07/25 Python
学习python之编写简单简单连接数据库并执行查询操作
2016/02/27 Python
Python爬虫爬验证码实现功能详解
2016/04/14 Python
Python Web框架之Django框架cookie和session用法分析
2019/08/16 Python
python性能测量工具cProfile使用解析
2019/09/26 Python
Python实现图像的垂直投影示例
2020/01/17 Python
基于Python实现下载网易音乐代码实例
2020/08/10 Python
Python私有属性私有方法应用实例解析
2020/09/15 Python
Python为何不支持switch语句原理详解
2020/10/21 Python
CSS3中Animation属性的使用详解
2015/08/06 HTML / CSS
Ajax主要包含了哪些技术
2014/06/12 面试题
家长给孩子的表扬信
2014/01/17 职场文书
食品安全责任书
2014/04/15 职场文书
党的群众路线教育实践活动对照检查材料(四风)
2014/09/27 职场文书
2015年个人审计工作总结
2015/04/07 职场文书
深入理解以DEBUG方式线程的底层运行原理
2021/06/21 Java/Android