Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python装饰器用法示例小结
Feb 11 Python
解决PyCharm的Python.exe已经停止工作的问题
Nov 29 Python
对pandas的算术运算和数据对齐实例详解
Dec 22 Python
Python简单基础小程序的实例代码
Apr 28 Python
python 字典 setdefault()和get()方法比较详解
Aug 07 Python
Python爬虫运用正则表达式的方法和优缺点
Aug 25 Python
pytorch torch.expand和torch.repeat的区别详解
Nov 05 Python
Tensorflow实现部分参数梯度更新操作
Jan 23 Python
Python计算IV值的示例讲解
Feb 28 Python
Python中使用Selenium环境安装的方法步骤
Feb 22 Python
python实现简单文件读写函数
Feb 25 Python
如何利用pygame实现打飞机小游戏
May 30 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
PHP 读取文件的正确方法
2009/04/29 PHP
PHP生成静态HTML页面最简单方法示例
2015/04/09 PHP
laravel框架实现为 Blade 模板引擎添加新文件扩展名操作示例
2020/01/25 PHP
一个很简单的办法实现TD的加亮效果.
2006/06/29 Javascript
IE/FireFox具备兼容性的拖动代码
2007/08/13 Javascript
真正的JQuery.ajax传递中文参数的解决方法
2011/05/28 Javascript
Javascript类定义语法,私有成员、受保护成员、静态成员等介绍
2011/12/08 Javascript
js判断屏幕分辨率的代码
2013/07/16 Javascript
Javascript实现返回上一页面并刷新的小例子
2013/12/11 Javascript
jQuery解析XML文件同时动态增加js文件的方法
2015/06/01 Javascript
在HTML中插入JavaScript代码的示例
2015/06/03 Javascript
js生成随机数的过程解析
2015/11/24 Javascript
vue实现登陆登出的实现示例
2017/09/15 Javascript
vue watch深度监听对象实现数据联动效果
2018/08/16 Javascript
微信小程序scroll-view实现滚动穿透和阻止滚动的方法
2018/08/20 Javascript
js计算两个日期间的天数月的实例代码
2018/09/20 Javascript
JavaScript类的继承操作实例总结
2018/12/20 Javascript
Preload基础使用方法详解
2020/02/03 Javascript
AI小程序之语音听写来了,十分钟掌握百度大脑语音听写全攻略
2020/03/13 Javascript
js实现简单进度条效果
2020/03/25 Javascript
Vue 中如何将函数作为 props 传递给组件的实现代码
2020/05/12 Javascript
[54:57]DOTA2-DPC中国联赛定级赛 Aster vs DLG BO3第二场 1月8日
2021/03/11 DOTA
在Python中操作字典之update()方法的使用
2015/05/22 Python
Python的re模块正则表达式操作
2016/05/25 Python
Python lxml解析HTML并用xpath获取元素的方法
2019/01/02 Python
Django之富文本(获取内容,设置内容方式)
2020/05/21 Python
Python OpenCV中的numpy与图像类型转换操作
2020/12/11 Python
SHEIN香港:价格实惠的女性时尚服装
2018/08/14 全球购物
医大实习自我鉴定
2013/12/07 职场文书
2014厂务公开实施方案
2014/02/17 职场文书
物业管理工作方案
2014/05/10 职场文书
2014年作风建设心得体会
2014/10/22 职场文书
学前班学生评语
2014/12/29 职场文书
2015年助残日活动总结
2015/03/27 职场文书
2015年扫黄打非工作总结
2015/05/13 职场文书
学校2016年圣诞节活动总结
2016/03/31 职场文书