python 实现读取csv数据,分类求和 再写进 csv


Posted in Python onMay 18, 2020

这两天在测试过程中,遇到这样的问题:

数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。

比如说,这样的数据

python 实现读取csv数据,分类求和 再写进 csv

需要对AskPrice值相同对应的AskQuantity 统计出来。

直接上脚本 :

import pandas as pd
import csv
df=pd.read_csv('D:\test\orderBook.csv')
df_sum = df.groupby('AskPrice')['AskQuantity'].sum() 
df_sum.to_csv('D:\test\orderBook2.csv')

然后运行得到:

python 实现读取csv数据,分类求和 再写进 csv

这对于大数据量的处理特别方便。

补充知识:python处理csv文件(场景分类)

最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。

import numpy as np
import os
import xlrd
import pandas as pd
import shutil
list_0 = []
list_file = []
flag = []
filename = os.listdir('F:\工作\比赛\未来杯\image_scene_training\data')
af = pd.read_excel('19.xlsx')
ww = af.values.tolist()
for i in ww:
  for j in i:
    list_0.append(j)
for name in filename:
  list_file.append(name[0:-4])
 
for name in list_file:
  if name in list_0:
    flag.append(True)
  else:
    flag.append(False)
 
for name in list_file:
  if flag[list_file.index(name)]:
    oldname = u'F:\工作\比赛\未来杯\image_scene_training\data\\'+name+'.jpg'
    newname = u'F:\工作\比赛\未来杯\image_scene_training\\train_data\\beach\\'+name+'.jpg'
    shutil.copyfile(oldname,newname)

unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte

1:升级pip python -m pip install --upgrade pip

2:改python文件内容:找到lib\site-packages\pip\compat\__init__.py

return s.decode('utf-8')

将‘utf-8'改成'gbk'

以上这篇python 实现读取csv数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python自定义类的数组排序实现代码
Aug 28 Python
Python虚拟环境项目实例
Nov 20 Python
python实现批量解析邮件并下载附件
Jun 19 Python
python使用pipeline批量读写redis的方法
Feb 18 Python
python求最大值最小值方法总结
Jun 25 Python
tensorflow 只恢复部分模型参数的实例
Jan 06 Python
python爬虫实现获取下一页代码
Mar 13 Python
jupyter实现重新加载模块
Apr 16 Python
pycharm无法安装第三方库的问题及解决方法以scrapy为例(图解)
May 09 Python
pycharm 代码自动补全的实现方法(图文)
Sep 18 Python
详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据
Dec 13 Python
解决python的空格和tab混淆而报错的问题
Feb 26 Python
python 实现分组求和与分组累加求和代码
May 18 #Python
Django ORM实现按天获取数据去重求和例子
May 18 #Python
如何实现更换Jupyter Notebook内核Python版本
May 18 #Python
python mysql自增字段AUTO_INCREMENT值的修改方式
May 18 #Python
Pycharm安装并配置jupyter notebook的实现
May 18 #Python
Django中的AutoField字段使用
May 18 #Python
jupyter notebook运行命令显示[*](解决办法)
May 18 #Python
You might like
SONY SRF-22W(33W)的电路分析和维修案例
2021/03/02 无线电
PHP绕过open_basedir限制操作文件的方法
2018/06/10 PHP
php正则表达式使用方法整理集合
2020/01/31 PHP
基于jquery的$.ajax async使用
2011/10/19 Javascript
往光标所在位置插入值的js代码
2013/09/22 Javascript
jquery实现textarea 高度自适应
2015/03/11 Javascript
使用jquery实现仿百度自动补全特效
2015/07/23 Javascript
js中substr,substring,indexOf,lastIndexOf,split,replace的用法详解
2015/11/09 Javascript
JS中innerHTML和pasteHTML的区别实例分析
2016/06/22 Javascript
深入浅析JavaScript中的3DES
2016/08/24 Javascript
node.js中的事件处理机制详解
2016/11/26 Javascript
angular过滤器实现排序功能
2017/06/27 Javascript
jQuery 中msgTips 顶部弹窗效果实现代码
2017/08/14 jQuery
JS返回顶部实例代码
2020/08/09 Javascript
ReactNative中使用Redux架构总结
2017/12/15 Javascript
webpack 4.0.0-beta.0版本新特性介绍
2018/02/10 Javascript
webpack4+Vue搭建自己的Vue-cli项目过程分享
2018/08/29 Javascript
基于Angular中ng-controller父子级嵌套的相关属性详解
2018/10/08 Javascript
JavaScript判断浏览器版本的方法
2019/11/03 Javascript
python3生成随机数实例
2014/10/20 Python
python实现的守护进程(Daemon)用法实例
2015/06/02 Python
python引入导入自定义模块和外部文件的实例
2017/07/24 Python
用matplotlib画等高线图详解
2017/12/14 Python
详解tensorflow载入数据的三种方式
2018/04/24 Python
基于wxPython的GUI实现输入对话框(1)
2019/02/27 Python
Django组件cookie与session的具体使用
2019/06/05 Python
python使用mitmproxy抓取浏览器请求的方法
2019/07/02 Python
python实现复制大量文件功能
2019/08/31 Python
解决django-xadmin列表页filter关联对象搜索问题
2019/11/15 Python
Python实现文件压缩和解压的示例代码
2020/08/12 Python
GitHub上值得推荐的8个python 项目
2020/10/30 Python
美国第二大连锁书店:Books-A-Million
2017/12/28 全球购物
linux面试题参考答案(10)
2016/10/26 面试题
《望庐山瀑布》教学反思
2014/04/22 职场文书
费城故事观后感
2015/06/10 职场文书
pytorch中的numel函数用法说明
2021/05/13 Python