Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现简单截取中文字符串的方法
Jun 15 Python
Python求出0~100以内的所有素数
Jan 23 Python
Python变量赋值的秘密分享
Apr 03 Python
Python自动发送邮件的方法实例总结
Dec 08 Python
Python的numpy库下的几个小函数的用法(小结)
Jul 12 Python
python scipy卷积运算的实现方法
Sep 16 Python
Python爬虫之urllib基础用法教程
Oct 12 Python
Pytorch 使用不同版本的cuda的方法步骤
Apr 02 Python
详解Python调用系统命令的六种方法
Jan 28 Python
Python获取百度热搜的完整代码
Apr 07 Python
MATLAB 如何求取离散点的曲率最大值
Apr 16 Python
Python类方法总结讲解
Jul 26 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
浅谈php命令行用法
2015/02/04 PHP
php按单词截取字符串的方法
2015/04/07 PHP
详解WordPress中给链接添加查询字符串的方法
2015/12/18 PHP
Laravel5中防止XSS跨站攻击的方法
2016/10/10 PHP
ThinkPHP中create()方法自动验证表单信息
2017/04/28 PHP
PHP日期和时间函数的使用示例详解
2020/08/06 PHP
20个非常有用的PHP类库 加速php开发
2010/01/15 Javascript
浅析Prototype的模板类 Template
2011/12/07 Javascript
JavaScript的继承的封装介绍
2013/10/15 Javascript
json中换行符的处理方法示例介绍
2014/06/10 Javascript
DOM 高级编程
2015/05/06 Javascript
浅析jQuery 3.0中的Data
2016/06/14 Javascript
BootStrap学习系列之Bootstrap Typeahead 组件实现百度下拉效果(续)
2016/07/07 Javascript
微信小程序 下拉菜单简单实例
2017/04/13 Javascript
Vue项目中添加锁屏功能实现思路
2018/06/29 Javascript
解决v-for中使用v-if或者v-bind:class失效的问题
2018/09/25 Javascript
JavaScript原生数组函数实例汇总
2020/10/14 Javascript
Vue表单提交点击事件只允许点击一次的实例
2020/10/23 Javascript
Javascript生成器(Generator)的介绍与使用
2021/01/31 Javascript
Python设计模式之观察者模式实例
2014/04/26 Python
Python的pycurl包用法简介
2015/11/13 Python
python 循环while和for in简单实例
2016/08/16 Python
Python基于分析Ajax请求实现抓取今日头条街拍图集功能示例
2018/07/19 Python
计算机二级python学习教程(1) 教大家如何学习python
2019/05/16 Python
python基于SMTP协议发送邮件
2019/05/31 Python
python config文件的读写操作示例
2019/09/27 Python
python 使用shutil复制图片的例子
2019/12/13 Python
python字典通过值反查键的实现(简洁写法)
2020/09/30 Python
PHP面试题大全
2015/10/16 面试题
声明struct x1 { . . . }; 和typedef struct { . . . }x2;有什么不同
2012/06/02 面试题
企业消防安全制度
2014/02/02 职场文书
个人租房协议书
2014/04/09 职场文书
党员教师自我剖析材料
2014/09/29 职场文书
卖车协议书范本4篇
2014/10/01 职场文书
分居协议书范本
2014/11/03 职场文书
2015年端午节国旗下演讲稿
2015/03/19 职场文书