python 实现读取csv数据,分类求和 再写进 csv


Posted in Python onMay 18, 2020

这两天在测试过程中,遇到这样的问题:

数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。

比如说,这样的数据

python 实现读取csv数据,分类求和 再写进 csv

需要对AskPrice值相同对应的AskQuantity 统计出来。

直接上脚本 :

import pandas as pd
import csv
df=pd.read_csv('D:\test\orderBook.csv')
df_sum = df.groupby('AskPrice')['AskQuantity'].sum() 
df_sum.to_csv('D:\test\orderBook2.csv')

然后运行得到:

python 实现读取csv数据,分类求和 再写进 csv

这对于大数据量的处理特别方便。

补充知识:python处理csv文件(场景分类)

最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。

import numpy as np
import os
import xlrd
import pandas as pd
import shutil
list_0 = []
list_file = []
flag = []
filename = os.listdir('F:\工作\比赛\未来杯\image_scene_training\data')
af = pd.read_excel('19.xlsx')
ww = af.values.tolist()
for i in ww:
  for j in i:
    list_0.append(j)
for name in filename:
  list_file.append(name[0:-4])
 
for name in list_file:
  if name in list_0:
    flag.append(True)
  else:
    flag.append(False)
 
for name in list_file:
  if flag[list_file.index(name)]:
    oldname = u'F:\工作\比赛\未来杯\image_scene_training\data\\'+name+'.jpg'
    newname = u'F:\工作\比赛\未来杯\image_scene_training\\train_data\\beach\\'+name+'.jpg'
    shutil.copyfile(oldname,newname)

unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte

1:升级pip python -m pip install --upgrade pip

2:改python文件内容:找到lib\site-packages\pip\compat\__init__.py

return s.decode('utf-8')

将‘utf-8'改成'gbk'

以上这篇python 实现读取csv数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python单链表的简单实现方法
Sep 23 Python
python入门之语句(if语句、while语句、for语句)
Jan 19 Python
Python中asyncore异步模块的用法及实现httpclient的实例
Jun 28 Python
使用pyecharts无法import Bar的解决方案
Apr 23 Python
对python添加模块路径的三种方法总结
Oct 16 Python
Python 私有化操作实例分析
Nov 21 Python
Python 实现数组相减示例
Dec 27 Python
Python实现i人事自动打卡的示例代码
Jan 09 Python
flask框架url与重定向操作实例详解
Jan 25 Python
详解python内置常用高阶函数(列出了5个常用的)
Feb 21 Python
将pymysql获取到的数据类型是tuple转化为pandas方式
May 15 Python
如何写python的配置文件
Jun 07 Python
python 实现分组求和与分组累加求和代码
May 18 #Python
Django ORM实现按天获取数据去重求和例子
May 18 #Python
如何实现更换Jupyter Notebook内核Python版本
May 18 #Python
python mysql自增字段AUTO_INCREMENT值的修改方式
May 18 #Python
Pycharm安装并配置jupyter notebook的实现
May 18 #Python
Django中的AutoField字段使用
May 18 #Python
jupyter notebook运行命令显示[*](解决办法)
May 18 #Python
You might like
简单的过滤字符串中的HTML标记
2006/12/25 PHP
thinkPHP实现的省市区三级联动功能示例
2017/05/05 PHP
php实现微信原生支付(扫码支付)功能
2018/05/30 PHP
用正则获取指定路径文件的名称
2007/02/27 Javascript
学习YUI.Ext 第七天--关于View&JSONView
2007/03/10 Javascript
javascript下对于事件、事件流、事件触发的顺序随便说说
2010/07/17 Javascript
jquery移动listbox的值原理及代码
2013/05/03 Javascript
js获取光标位置和设置文本框光标位置示例代码
2014/01/09 Javascript
js实现仿百度瀑布流的方法
2015/02/05 Javascript
jQuery获取父元素节点、子元素节点及兄弟元素节点的方法
2016/04/14 Javascript
JavaScript九九乘法口诀表的简单实现
2016/10/04 Javascript
详解angular 中的自定义指令之详解API
2017/06/20 Javascript
Vue-Access-Control 前端用户权限控制解决方案
2017/12/01 Javascript
快速搭建vue2.0+boostrap项目的方法
2018/04/09 Javascript
react中Suspense的使用详解
2019/09/01 Javascript
JS实现商城秒杀倒计时功能(动态设置秒杀时间)
2019/12/12 Javascript
Node.js API详解之 os模块用法实例分析
2020/05/06 Javascript
JS数据类型判断的几种常用方法
2020/07/07 Javascript
简单的Python抓taobao图片爬虫
2014/10/26 Python
selenium python浏览器多窗口处理代码示例
2018/01/15 Python
python 实现将文件或文件夹用相对路径打包为 tar.gz 文件的方法
2019/06/10 Python
Jupyter Notebook打开任意文件夹操作
2020/04/14 Python
Python局部变量与全局变量区别原理解析
2020/07/14 Python
Pycharm中使用git进行合作开发的教程详解
2020/11/17 Python
英国最大的在线奢侈手表零售商:Jura Watches
2018/01/29 全球购物
俄罗斯第一家多品牌在线奢侈品精品店:Aizel.ru
2020/09/06 全球购物
生物技术专业研究生自荐信
2013/09/22 职场文书
税务专业毕业生自荐信
2013/11/10 职场文书
《鞋匠的儿子》教学反思
2014/03/02 职场文书
商务助理求职信范文
2014/04/20 职场文书
学雷锋日活动总结
2015/02/06 职场文书
2016年春季运动会加油稿
2015/07/22 职场文书
合同补充协议书
2016/03/24 职场文书
班干部竞选演讲稿(精选5篇)
2019/09/24 职场文书
2019年市场部个人述职报告(三篇)
2019/10/23 职场文书
pytorch中的torch.nn.Conv2d()函数图文详解
2022/02/28 Python