Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 过滤字符串的技巧,map与itertools.imap
Sep 06 Python
Python3 适合初学者学习的银行账户登录系统实例
Aug 08 Python
使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法
Jun 22 Python
对pycharm 修改程序运行所需内存详解
Dec 03 Python
python制作mysql数据迁移脚本
Jan 01 Python
解决Python中定时任务线程无法自动退出的问题
Feb 18 Python
8种用Python实现线性回归的方法对比详解
Jul 10 Python
Python Django Cookie 简单用法解析
Aug 13 Python
Python 类的私有属性和私有方法实例分析
Sep 29 Python
python 实现按对象传值
Dec 26 Python
python模式 工厂模式原理及实例详解
Feb 11 Python
Java如何基于wsimport调用wcf接口
Jun 17 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
Netflix将与CLAMP、乙一以及冲方丁等6名知名制作人合伙展开原创动画计划!
2020/03/06 日漫
十天学会php之第十天
2006/10/09 PHP
php $_SERVER当前完整url的写法
2009/11/12 PHP
微信 getAccessToken方法详解及实例
2016/11/23 PHP
javascript 写类方式之二
2009/07/05 Javascript
jquery select操作的日期联动实现代码
2009/12/06 Javascript
JqGrid web打印实现代码
2011/05/31 Javascript
JavaScript通过RegExp实现客户端验证处理程序
2013/05/07 Javascript
JavaScript解析URL参数示例代码
2013/08/12 Javascript
JavaScript获取多个数组的交集简单实例
2013/11/11 Javascript
14款NodeJS Web框架推荐
2014/07/11 NodeJs
分享9个最好用的JavaScript开发工具和代码编辑器
2015/03/24 Javascript
jQuery插件slicebox实现3D动画图片轮播切换特效
2015/04/12 Javascript
jquery表格datatables实例解析 直接加载和延迟加载
2016/08/12 Javascript
vue元素实现动画过渡效果
2017/07/01 Javascript
JavaScript实现时间表动态效果
2017/07/15 Javascript
react-native 完整实现登录功能的示例代码
2017/09/11 Javascript
Vue header组件开发详解
2018/01/26 Javascript
JS实现的类似微信聊天效果示例
2019/01/29 Javascript
15分钟学会vue项目改造成SSR(小白教程)
2019/12/17 Javascript
Python实现的下载8000首儿歌的代码分享
2014/11/21 Python
Python语法快速入门指南
2015/10/12 Python
python使用rpc框架gRPC的方法
2018/08/24 Python
python用match()函数爬数据方法详解
2019/07/23 Python
使用django和vue进行数据交互的方法步骤
2019/11/11 Python
在tensorflow下利用plt画论文中loss,acc等曲线图实例
2020/06/15 Python
Python数据模型与Python对象模型的相关总结
2021/01/26 Python
小程序瀑布流解决左右两边高度差距过大的问题
2019/02/20 HTML / CSS
DIY手工制作经营店创业计划书
2014/02/01 职场文书
写自荐信的注意事项
2014/03/09 职场文书
班班通校本培训方案
2014/03/12 职场文书
高中美术教师事迹材料
2014/08/22 职场文书
党员评议表自我评价范文
2014/10/20 职场文书
2014年教研员工作总结
2014/12/23 职场文书
社区党员干部承诺书
2015/05/04 职场文书
《辉夜大小姐想让我告白》第三季正式预告
2022/03/20 日漫