编程 Python

Python csv文件记录流程代码解析

Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件：

使用cmd到所在盘下，输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件：

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入，但是出现乱码原因应该为csv的BOM没有更改

解决方法：将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列，有一些出现第二列，原因是一句话里面出现了逗号

解决方法：遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件，还在继续检查中

3、删除一些字符，如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项：

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt，二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python csv文件记录流程代码解析

- Author -

吉吉的奥利奥

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python计算最小优先级队列代码分享

Dec 18 Python

Python外星人入侵游戏编程完整版

Mar 30 Python

python+pyqt实现右下角弹出框

Oct 26 Python

python调用API实现智能回复机器人

Apr 10 Python

Python中的random.uniform()函数教程与实例解析

Mar 02 Python

python生成器推导式用法简单示例

Oct 08 Python

Python编译成.so文件进行加密后调用的实现

Dec 23 Python

python中文分词库jieba使用方法详解

Feb 11 Python

在pycharm中为项目导入anacodna环境的操作方法

Feb 12 Python

python和php学习哪个更有发展

Jun 17 Python

利用Python pandas对Excel进行合并的方法示例

Nov 04 Python

Python页面加载的等待方式总结

Feb 28 Python

Python 抓取数据存储到Redis中的操作

Jul 16 #Python

django filter过滤器实现显示某个类型指定字段不同值方式

Jul 16 #Python

解决python对齐错误的方法

Jul 16 #Python

Python爬虫实例——爬取美团美食数据

Jul 15 #Python

django Model层常用验证器及自定义验证器详解

Jul 15 #Python

浅谈Django前端后端值传递问题

Jul 15 #Python

浅谈python出错时traceback的解读

Jul 15 #Python

You might like

在PHP中操作Excel实例代码

2010/04/29 PHP

PHP页面输出搜索后跳转下一页的处理方法

2016/09/30 PHP

Laravel模型事件的实现原理详解

2018/03/14 PHP

PHP vsprintf()函数格式化字符串操作原理解析

2020/07/14 PHP

datePicker——日期选择控件（with jquery）

2007/02/20 Javascript

dojo学习第二天 ajax异步请求之绑定列表

2011/08/29 Javascript

JQuery操作tr和td内容的方法实例

2013/03/06 Javascript

自己封装的javascript事件队列函数版

2014/06/12 Javascript

浅谈 jQuery 事件源码定位问题

2014/06/18 Javascript

引用其它js时如何同时处理多个window.onload事件

2014/09/02 Javascript

jQuery中:last-child选择器用法实例

2014/12/31 Javascript

jQuery实现在下拉列表选择时获取json数据的方法

2015/04/16 Javascript

原生js和jQuery写的网页选项卡特效对比

2015/04/27 Javascript

js+html5获取用户地理位置信息并在Google地图上显示的方法

2015/06/05 Javascript

轻松掌握jQuery中wrap()与unwrap()函数的用法

2016/05/24 Javascript

jQuery纵向导航菜单效果实现方法

2016/12/19 Javascript

js实现控制文件拖拽并获取拖拽内容功能

2018/02/17 Javascript

vue filter 完美时间日期格式的代码

2019/08/14 Javascript

微信小程序日历插件代码实例

2019/12/04 Javascript

JavaScript对象访问器Getter及Setter原理解析

2020/12/08 Javascript

利用Python画ROC曲线和AUC值计算

2016/09/19 Python

Python3使用PyQt5制作简单的画板/手写板实例

2017/10/19 Python

python中判断文件编码的chardet(实例讲解)

2017/12/21 Python

详解python之协程gevent模块

2018/06/14 Python

python散点图实例之随机漫步

2018/08/27 Python

ubuntu16.04制作vim和python3的开发环境

2018/09/23 Python

Django CSRF跨站请求伪造防护过程解析

2019/07/31 Python

Python调用钉钉自定义机器人的实现

2020/01/03 Python

Python如何将图像音视频等资源文件隐藏在代码中(小技巧)

2020/02/16 Python

UGG美国官网：购买UGG雪地靴、拖鞋和鞋子

2017/12/31 全球购物

初中生学习生活的自我评价

2013/11/20 职场文书

英语教育专业毕业生求职信

2014/08/28 职场文书

学生检讨书范文

2015/01/27 职场文书

2015年派出所民警工作总结

2015/04/24 职场文书

CSS中em的正确打开方式详解

2021/04/08 HTML / CSS

Python 详解通过Scrapy框架实现爬取百度新冠疫情数据流程

2021/11/11 Python