python 实现读取csv数据,分类求和 再写进 csv


Posted in Python onMay 18, 2020

这两天在测试过程中,遇到这样的问题:

数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。

比如说,这样的数据

python 实现读取csv数据,分类求和 再写进 csv

需要对AskPrice值相同对应的AskQuantity 统计出来。

直接上脚本 :

import pandas as pd
import csv
df=pd.read_csv('D:\test\orderBook.csv')
df_sum = df.groupby('AskPrice')['AskQuantity'].sum() 
df_sum.to_csv('D:\test\orderBook2.csv')

然后运行得到:

python 实现读取csv数据,分类求和 再写进 csv

这对于大数据量的处理特别方便。

补充知识:python处理csv文件(场景分类)

最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。

import numpy as np
import os
import xlrd
import pandas as pd
import shutil
list_0 = []
list_file = []
flag = []
filename = os.listdir('F:\工作\比赛\未来杯\image_scene_training\data')
af = pd.read_excel('19.xlsx')
ww = af.values.tolist()
for i in ww:
  for j in i:
    list_0.append(j)
for name in filename:
  list_file.append(name[0:-4])
 
for name in list_file:
  if name in list_0:
    flag.append(True)
  else:
    flag.append(False)
 
for name in list_file:
  if flag[list_file.index(name)]:
    oldname = u'F:\工作\比赛\未来杯\image_scene_training\data\\'+name+'.jpg'
    newname = u'F:\工作\比赛\未来杯\image_scene_training\\train_data\\beach\\'+name+'.jpg'
    shutil.copyfile(oldname,newname)

unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte

1:升级pip python -m pip install --upgrade pip

2:改python文件内容:找到lib\site-packages\pip\compat\__init__.py

return s.decode('utf-8')

将‘utf-8'改成'gbk'

以上这篇python 实现读取csv数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python的setuptools框架下生成egg的教程
Apr 13 Python
深入理解Python中各种方法的运作原理
Jun 15 Python
python中map的基本用法示例
Sep 10 Python
python+unittest+requests实现接口自动化的方法
Nov 29 Python
全面了解django的缓存机制及使用方法
Jul 22 Python
Pycharm中出现ImportError:DLL load failed:找不到指定模块的解决方法
Sep 17 Python
Python 获取numpy.array索引值的实例
Dec 06 Python
Python smtp邮件发送模块用法教程
Jun 15 Python
记一次django内存异常排查及解决方法
Aug 07 Python
python3将变量输入的简单实例
Aug 19 Python
如何解决python多种版本冲突问题
Oct 13 Python
python tkinter Entry控件的焦点移动操作
May 22 Python
python 实现分组求和与分组累加求和代码
May 18 #Python
Django ORM实现按天获取数据去重求和例子
May 18 #Python
如何实现更换Jupyter Notebook内核Python版本
May 18 #Python
python mysql自增字段AUTO_INCREMENT值的修改方式
May 18 #Python
Pycharm安装并配置jupyter notebook的实现
May 18 #Python
Django中的AutoField字段使用
May 18 #Python
jupyter notebook运行命令显示[*](解决办法)
May 18 #Python
You might like
超级简单的php+mysql留言本源码
2009/11/11 PHP
Window 7/XP 安装Apache 2.4与PHP 5.4 的过程详解
2013/06/02 PHP
使用php方法curl抓取AJAX异步内容思路分析及代码分享
2014/08/25 PHP
php mysql like 实现多关键词搜索的方法
2016/10/29 PHP
PHP AjaxForm提交图片上传并显示图片源码
2016/11/29 PHP
PHP简单实现遍历目录下特定文件的方法小结
2017/05/22 PHP
PHP+jQuery实现即点即改功能示例
2019/02/21 PHP
JavaScript 盒模型 尺寸深入理解
2012/12/31 Javascript
JS的document.all函数使用示例
2013/12/30 Javascript
js实现ifram取父窗口URL地址的方法
2015/02/09 Javascript
再次谈论React.js实现原生js拖拽效果引起的一系列问题
2016/04/03 Javascript
适用于手机端的jQuery图片滑块动画
2016/12/09 Javascript
jQuery animate()实现背景色渐变效果的处理方法【使用jQuery.color.js插件】
2017/03/15 Javascript
详解nodejs中的process进程
2017/03/19 NodeJs
JavaScript严格模式下关于this的几种指向详解
2017/07/12 Javascript
JS组件系列之Gojs组件 前端图形化插件之利器
2017/11/29 Javascript
vue.js 实现点击展开收起动画效果
2018/07/07 Javascript
vue中过滤器filter的讲解
2019/01/21 Javascript
Vue项目如何引入bootstrap、elementUI、echarts
2020/11/26 Vue.js
[05:49]DOTA2-DPC中国联赛 正赛 Elephant vs LBZS 选手采访
2021/03/11 DOTA
python自动登录12306并自动点击验证码完成登录的实现源代码
2018/04/25 Python
python从子线程中获得返回值的方法
2019/01/30 Python
springboot配置文件抽离 git管理统 配置中心详解
2019/09/02 Python
树莓派安装OpenCV3完整过程的实现
2019/10/10 Python
PYQT5开启多个线程和窗口,多线程与多窗口的交互实例
2019/12/13 Python
基于Python 中函数的 收集参数 机制
2019/12/21 Python
配置python的编程环境之Anaconda + VSCode的教程
2020/03/29 Python
TensorFlow2.X使用图片制作简单的数据集训练模型
2020/04/08 Python
详解pandas映射与数据转换
2021/01/22 Python
Pytorch之扩充tensor的操作
2021/03/04 Python
英语系本科生个人求职信
2013/09/21 职场文书
统计学专业毕业生的自我评价分享
2013/11/28 职场文书
三年大学自我鉴定
2014/01/16 职场文书
团日活动总结范文
2014/04/25 职场文书
主题班会演讲稿
2014/05/22 职场文书
2014城乡环境综合治理工作总结
2014/12/19 职场文书