Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中文竖排显示的方法
Jul 28 Python
python将unicode转为str的方法
Jun 21 Python
简单谈谈python中的lambda表达式
Jan 19 Python
Python实现获取前100组勾股数的方法示例
May 04 Python
python生成多个只含0,1元素的随机数组或列表的实例
Nov 12 Python
详解django2中关于时间处理策略
Mar 06 Python
Python魔法方法 容器部方法详解
Jan 02 Python
使用python绘制cdf的多种实现方法
Feb 25 Python
python GUI库图形界面开发之PyQt5 UI主线程与耗时线程分离详细方法实例
Feb 26 Python
pygame实现弹球游戏
Apr 14 Python
python实现数字炸弹游戏
Jul 17 Python
关于python中模块和重载的问题
Nov 02 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
PHP 字符串长度判断效率更高的方法
2014/03/02 PHP
ThinkPHP之N方法实例详解
2014/06/20 PHP
使用jQuery简化Ajax开发 Ajax开发入门
2009/10/14 Javascript
js 加载并解析XML字符串的代码
2009/12/13 Javascript
利用腾讯的ip地址库做ip物理地址定位
2010/07/24 Javascript
jquery 循环显示div的示例代码
2013/10/18 Javascript
把普通对象转换成json格式的对象的简单实例
2016/07/04 Javascript
jQuery ajaxForm()的应用
2016/10/14 Javascript
AngularJS中如何使用echart插件示例详解
2016/10/26 Javascript
AngularJS实现网站换肤实例
2021/02/19 Javascript
Vue实现数字输入框中分割手机号码的示例
2017/10/10 Javascript
解决angular2 获取到的数据无法实时更新的问题
2018/08/31 Javascript
python实现简单聊天应用 python群聊和点对点均实现
2017/09/14 Python
解决python 输出是省略号的问题
2018/04/19 Python
Python3 关于pycharm自动导入包快捷设置的方法
2019/01/16 Python
Python日志无延迟实时写入的示例
2019/07/11 Python
python实现批量nii文件转换为png图像
2019/07/18 Python
Python使用turtle库绘制小猪佩奇(实例代码)
2020/01/16 Python
css3 position fixed固定居中问题解决方案
2014/08/19 HTML / CSS
世界顶级户外运动品牌折扣网站:LeftLane Sports
2019/06/12 全球购物
C&A巴西网上商店:时尚、衣服、手机和鞋子
2020/06/07 全球购物
简述进程的启动、终止的方式以及如何进行进程的查看
2014/02/20 面试题
员工自我鉴定范文
2013/10/06 职场文书
学前教育毕业生自荐信
2013/10/29 职场文书
酒店总经理工作职责
2013/12/13 职场文书
汽车队司机先进事迹材料
2014/02/01 职场文书
超市总经理岗位职责
2014/02/02 职场文书
餐饮总经理岗位职责
2014/03/07 职场文书
田径运动会开幕式及主持词
2014/03/28 职场文书
公司离职证明范本(汇总)
2014/09/10 职场文书
高考升学宴答谢词
2015/01/20 职场文书
个人求职信格式范文
2015/03/20 职场文书
毕业班工作总结
2015/08/10 职场文书
英语版自我评价,35句话轻松搞定
2019/10/08 职场文书
python中requests库+xpath+lxml简单使用
2021/04/29 Python
zabbix自定义监控nginx状态实现过程
2021/11/01 Servers