Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python计算最小优先级队列代码分享
Dec 18 Python
Python外星人入侵游戏编程完整版
Mar 30 Python
python+pyqt实现右下角弹出框
Oct 26 Python
python调用API实现智能回复机器人
Apr 10 Python
Python中的random.uniform()函数教程与实例解析
Mar 02 Python
python生成器推导式用法简单示例
Oct 08 Python
Python编译成.so文件进行加密后调用的实现
Dec 23 Python
python中文分词库jieba使用方法详解
Feb 11 Python
在pycharm中为项目导入anacodna环境的操作方法
Feb 12 Python
python和php学习哪个更有发展
Jun 17 Python
利用Python pandas对Excel进行合并的方法示例
Nov 04 Python
Python页面加载的等待方式总结
Feb 28 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
在PHP中操作Excel实例代码
2010/04/29 PHP
PHP页面输出搜索后跳转下一页的处理方法
2016/09/30 PHP
Laravel模型事件的实现原理详解
2018/03/14 PHP
PHP vsprintf()函数格式化字符串操作原理解析
2020/07/14 PHP
datePicker——日期选择控件(with jquery)
2007/02/20 Javascript
dojo学习第二天 ajax异步请求之绑定列表
2011/08/29 Javascript
JQuery操作tr和td内容的方法实例
2013/03/06 Javascript
自己封装的javascript事件队列函数版
2014/06/12 Javascript
浅谈 jQuery 事件源码定位问题
2014/06/18 Javascript
引用其它js时如何同时处理多个window.onload事件
2014/09/02 Javascript
jQuery中:last-child选择器用法实例
2014/12/31 Javascript
jQuery实现在下拉列表选择时获取json数据的方法
2015/04/16 Javascript
原生js和jQuery写的网页选项卡特效对比
2015/04/27 Javascript
js+html5获取用户地理位置信息并在Google地图上显示的方法
2015/06/05 Javascript
轻松掌握jQuery中wrap()与unwrap()函数的用法
2016/05/24 Javascript
jQuery纵向导航菜单效果实现方法
2016/12/19 Javascript
js实现控制文件拖拽并获取拖拽内容功能
2018/02/17 Javascript
vue filter 完美时间日期格式的代码
2019/08/14 Javascript
微信小程序日历插件代码实例
2019/12/04 Javascript
JavaScript对象访问器Getter及Setter原理解析
2020/12/08 Javascript
利用Python画ROC曲线和AUC值计算
2016/09/19 Python
Python3使用PyQt5制作简单的画板/手写板实例
2017/10/19 Python
python中判断文件编码的chardet(实例讲解)
2017/12/21 Python
详解python之协程gevent模块
2018/06/14 Python
python散点图实例之随机漫步
2018/08/27 Python
ubuntu16.04制作vim和python3的开发环境
2018/09/23 Python
Django CSRF跨站请求伪造防护过程解析
2019/07/31 Python
Python调用钉钉自定义机器人的实现
2020/01/03 Python
Python如何将图像音视频等资源文件隐藏在代码中(小技巧)
2020/02/16 Python
UGG美国官网:购买UGG雪地靴、拖鞋和鞋子
2017/12/31 全球购物
初中生学习生活的自我评价
2013/11/20 职场文书
英语教育专业毕业生求职信
2014/08/28 职场文书
学生检讨书范文
2015/01/27 职场文书
2015年派出所民警工作总结
2015/04/24 职场文书
CSS中em的正确打开方式详解
2021/04/08 HTML / CSS
Python 详解通过Scrapy框架实现爬取百度新冠疫情数据流程
2021/11/11 Python