Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的zipfile模块使用详解
Jun 25 Python
Python程序中用csv模块来操作csv文件的基本使用教程
Mar 03 Python
python简单实现刷新智联简历
Mar 30 Python
Django1.7+python 2.78+pycharm配置mysql数据库
Oct 09 Python
使用python语言,比较两个字符串是否相同的实例
Jun 29 Python
Python实现Dijkstra算法
Oct 17 Python
python selenium 查找隐藏元素 自动播放视频功能
Jul 24 Python
python 利用turtle库绘制笑脸和哭脸的例子
Nov 23 Python
python中的subprocess.Popen()使用详解
Dec 25 Python
安装Anaconda3及使用Jupyter的方法
Oct 27 Python
python3.7中安装paddleocr及paddlepaddle包的多种方法
Nov 27 Python
Pytorch 中net.train 和 net.eval的使用说明
May 22 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
深入掌握include_once与require_once的区别
2013/06/17 PHP
如何使用jQuery+PHP+MySQL来实现一个在线测试项目
2015/04/26 PHP
详解在PHP的Yii框架中使用行为Behaviors的方法
2016/03/18 PHP
Laravel框架Eloquent ORM简介、模型建立及查询数据操作详解
2019/12/04 PHP
实用javaScript技术-屏蔽类
2006/08/15 Javascript
Jquery数独游戏解析(一)-页面布局
2010/11/05 Javascript
JavaScript 程序编码规范
2010/11/23 Javascript
jquery 回车事件实现代码
2011/08/23 Javascript
jquery动态添加删除(tr/td)
2015/02/09 Javascript
jquery实现先淡出再折叠收起的动画效果
2015/08/07 Javascript
JavaScript的设计模式经典之代理模式
2016/02/24 Javascript
全面了解JS中的匿名函数
2016/06/29 Javascript
Augularjs-起步详解
2016/07/08 Javascript
Bootstrap 3多级下拉菜单实例
2017/11/23 Javascript
详解React项目的服务端渲染改造(koa2+webpack3.11)
2018/03/19 Javascript
node.js使用免费的阿里云ip查询获取ip所在地【推荐】
2018/09/03 Javascript
新手快速入门微信小程序组件库 iView Weapp
2019/06/24 Javascript
使用localStorage替代cookie做本地存储
2019/09/25 Javascript
python实现360的字符显示界面
2014/02/21 Python
在Windows系统上搭建Nginx+Python+MySQL环境的教程
2015/12/25 Python
在windows下快速搭建web.py开发框架方法
2016/04/22 Python
python代码过长的换行方法
2018/07/19 Python
Python实现分段线性插值
2018/12/17 Python
python GUI库图形界面开发之PyQt5中QMainWindow, QWidget以及QDialog的区别和选择
2020/02/26 Python
墨西哥购物网站:Elektra
2020/01/21 全球购物
美术教师自我鉴定
2014/02/12 职场文书
庆元旦文艺演出主持词
2014/03/27 职场文书
个人担保书格式范文
2014/05/12 职场文书
在校实习生求职信
2014/06/18 职场文书
学雷锋标兵事迹材料
2014/08/18 职场文书
党员对照检查材料整改措施思想汇报
2014/09/26 职场文书
企业法人代表授权委托书
2014/10/02 职场文书
迟到检讨书2000字(精选篇)
2014/10/07 职场文书
2014办公室年度工作总结
2014/12/09 职场文书
2016幼儿园新学期寄语
2015/12/03 职场文书
MySQL数据库中varchar类型的数字比较大小的方法
2021/11/17 MySQL