编程 Python

python pandas 对时间序列文件处理的实例

Posted in Python onJune 22, 2018

如下所示：

import pandas as pd
from numpy import *
import matplotlib.pylab as plt
import copy

def read(filename):
 dat=pd.read_csv(filename,iterator=True)
 loop = True
 chunkSize = 1000000
 R=[]
 while loop:
  try:
   data = dat.get_chunk(chunkSize)
   data=data.loc[:,'B':'C'] # 切片
   data=data[data.B==855]  #条件选择
   data['C']=pd.to_datetime(data['C']) # 转换成时间格式
   data=data.set_index(['C'])    # 设置索引
   data.loc[:,'D']=array([1]*len(data)) #增加一列
   data=data.resample('D').sum() #按天求和
   data=data.loc[:,'D'] #截取
   data.fillna(0) #填充缺失值
   R.append(data)
  except StopIteration:
   loop = False
   print ("Iteration is stopped.")
 R.to_csv('855_pay.csv') # 保存

def read2(filename):
 reader=pd.read_csv(filename,iterator=True)
 loop = True
 chunkSize = 100000
 chunks = []
 while loop:
  try:
   chunk = reader.get_chunk(chunkSize)
   chunks.append(chunk)
  except StopIteration:
   loop = False
   print ("Iteration is stopped.")
 df = pd.concat(chunks, ignore_index=True)
 return df

def read3save(filename):
 dat=pd.read_csv(filename)
 #data = dat.get_chunk(chunkSize)
 data=dat.loc[:,'B':'C'] # 切片
 data=data[data.B==855]#条件选择
 print(shape(data))
 data['C']=pd.to_datetime(data['C']) # 转换成时间格式
 data=data.set_index(['C'])# 设置索引
 if len(data)==0:
  return
 data.loc[:,'D']=array([1]*len(data)) #增加一列
 data=data.resample('D').sum() #按天求和
 data=data.loc[:,'D'] #截取
 data.fillna(0) #填充缺失值
 data.to_csv('855_pay.csv',mode='a') # 保存

def loadDataSet(fileName, delim='\t'):
 fr = open(fileName)
 stringArr = [line.strip().split(delim) for line in fr.readlines()]
 datArr = [list(map(float,line)) for line in stringArr]
 return mat(datArr)

def getShopData():
 fr = open('shopInfo.txt')
 shopID = [line.strip().split('\n') for line in fr.readlines()]
 # datArr = [list(map(float,line))for line in stringArr]
 for i in range(1,9):
  name="user_pay.001.00%d"%i
  dat=pd.read_csv(name)
  #data = dat.get_chunk(chunkSize)
  data=dat.loc[:,'B':'C'] # 切片
  for factor in shopID:
   data=data[data.B==int(str(factor[0]))]#条件选择
   print(shape(data))
   if len(data)==0: continue
   data['C']=pd.to_datetime(data['C']) # 转换成时间格式
   data=data.set_index(['C'])# 设置索引
   data.loc[:,'D']=array([1]*len(data)) #增加一列
   data=data.resample('D').sum() #按天求和
   data=data.loc[:,'D'] #截取
   data.fillna(0) #填充缺失值
   s=str(factor[0])
   savename='D:\python\data\%s_pay.csv'%s
   data.to_csv(savename,mode='a') # 保存
   del dat
 print("over")

def tset(filename):
 dat=pd.read_csv(filename)
 #data = dat.get_chunk(chunkSize)
 data=dat.loc[:,'B':'C'] # 切片
 data=data[data.B==855]#条件选择
 print(shape(data))
 data['C']=pd.to_datetime(data['C']) # 转换成时间格式
 data=data.set_index(['C'])# 设置索引
 if len(data)==0:
  return
 data.loc[:,'D']=array([1]*len(data)) #增加一列
 data=data.resample('D').sum() #按天求和
 data=data.loc[:,'D'] #截取
 data.fillna(0) #填充缺失值
 #data.to_csv('855_pay.csv',mode='a') # 保存
 s='my'
 savename='D:\python\data\%s_pay.csv'%s
 data.to_csv(savename,mode='a') # 保存
  
def getShopData2(filename):
  import csv
 # fr = open('shopInfo.txt')
  # shopID = [line.strip().split('\n') for line in fr.readlines()]
 # datArr = [list(map(float,line))for line in stringArr]
 #for i in range(1,9):
 #name="user_pay.001.00%d"%i
  dat=pd.read_csv(filename)
  #data = dat.get_chunk(chunkSize)
  data=dat.loc[:,'B':'C'] # 切片
  data['C']=pd.to_datetime(data['C']) # 转换成时间格式
  data=data.set_index(['C'])# 设置索引
  data.loc[:,'D']=array([1]*len(data)) #增加一列
  for i in range(1,2001):
   d=copy.copy(data)
   d=d[data.B==i]#条件选择
   #print(shape(d))
   print(i)
   if len(d)==0: continue
   d=d.resample('D').sum() #按天求和
   d=d.loc[:,'D'] #截取
   d.fillna(0) #填充缺失值
   s=str(i)
   #print(s)
   savename='D:\python\data2\%s_pay.csv'%s
   c=open(savename,'a')
   writer=csv.writer(c)
   writer.writerow(['C','D'])
   c.close()
   d.to_csv(savename,mode='a') # 保存
   # del dat
   print("over")
def formatData():
  #fr = open('shopInfo.txt')
  #shopID = [line.strip().split('\n') for line in fr.readlines()]
 # datArr = [list(map(float,line))for line in stringArr]
  #data = dat.get_chunk(chunkSize)
  for i in range(1,2001):
   s=str(i)
   print(s)
   name='D:\python\data2\%s_pay.csv'%s
   dat=pd.read_csv(name)
   data['C']=pd.to_datetime(data['C']) # 转换成时间格式
   data=data.set_index(['C'])# 设置索引
   data=data.resample('D').sum() #按天求和
   data.fillna(0) #填充缺失值
   savename='D:\python\data3\%s_pay.csv'%s
   data.to_csv(savename,mode='w') # 保存
   del dat
   print("over")

以上这篇python pandas 对时间序列文件处理的实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

- Author -

Faith_yu

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python的Django框架中消息通知的计数器实现教程

Jun 13 Python

Python读取图片属性信息的实现方法

Sep 11 Python

Python使用内置json模块解析json格式数据的方法

Jul 20 Python

Python面向对象基础入门之设置对象属性

Dec 11 Python

Python企业编码生成系统总体系统设计概述

Jul 26 Python

python 使用while写猜年龄小游戏过程解析

Oct 07 Python

使用python远程操作linux过程解析

Dec 04 Python

使用tensorflow显示pb模型的所有网络结点方式

Jan 23 Python

python使用pyecharts库画地图数据可视化的实现

Mar 25 Python

python实现udp聊天窗口

Mar 31 Python

Selenium webdriver添加cookie实现过程详解

Aug 12 Python

python正则表达式re.search()的基本使用教程

May 21 Python

python使用turtle绘制分形树

Jun 22 #Python

python递归函数绘制分形树的方法

Jun 22 #Python

使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法

Jun 22 #Python

Python使用pandas处理CSV文件的实例讲解

Jun 22 #Python

python处理csv中的空值方法

Jun 22 #Python

Python实现base64编码的图片保存到本地功能示例

Jun 22 #Python

关于python2 csv写入空白行的问题

Jun 22 #Python

You might like

php利用cookie实现访问次数统计代码

2011/05/19 PHP

php版微信公众号自定义分享内容实现方法

2016/09/22 PHP

Yii2实现自定义独立验证器的方法

2017/05/05 PHP

PHP实现一维数组与二维数组去重功能示例

2018/05/24 PHP

javascript getElementsByClassName函数

2010/04/01 Javascript

关于Jquery操作Cookie取值错误的解决方法

2013/08/26 Javascript

JavaScript SetInterval与setTimeout使用方法详解

2013/11/15 Javascript

使用jquery选择器如何获取父级元素、同级元素、子元素

2014/05/14 Javascript

JavaScript插件化开发教程（五）

2015/02/01 Javascript

jQuery中extend函数的实现原理详解

2015/02/03 Javascript

jquery+CSS3实现淘宝移动网页菜单效果

2015/08/31 Javascript

angularJS与bootstrap结合实现动态加载弹出提示内容

2015/10/16 Javascript

gulp加批处理(.bat)实现ng多应用一键自动化构建

2017/02/16 Javascript

Vue响应式添加、修改数组和对象的值

2017/03/20 Javascript

ionic实现底部分享功能

2017/05/11 Javascript

js input输入百分号保存数据库失败的解决方法

2018/05/26 Javascript

JavaScript事件对象event用法分析

2018/07/27 Javascript

[05:34]2014DOTA2国际邀请赛中国区预选赛精彩TOPPLAY第二弹

2014/06/25 DOTA

在Django中同时使用多个配置文件的方法

2015/07/22 Python

Python随机生成数据后插入到PostgreSQL

2016/07/28 Python

运动检测ViBe算法python实现代码

2018/01/09 Python

Django 自定义分页器的实现代码

2019/11/24 Python

python中实现词云图的示例

2020/12/19 Python

意大利专业化妆品品牌：KIKO MILANO

2017/02/01 全球购物

Beach Bunny Swimwear官网：设计师泳装和性感比基尼

2019/03/13 全球购物

MAC Cosmetics官方网站：魅可专业艺术彩妆

2019/04/10 全球购物

巴西购物网站：Submarino

2020/01/19 全球购物

我们的节日端午节活动方案

2014/03/02 职场文书

2014年自愿离婚协议书范本

2014/09/25 职场文书

监考失职检讨书

2015/01/26 职场文书

员工辞职信范文大全

2015/05/12 职场文书

2015年电话客服工作总结

2015/05/18 职场文书

新学期开学标语2015

2015/07/16 职场文书

2019年大学生学年自我鉴定！

2019/03/25 职场文书

MySQL root密码的重置方法

2021/04/21 MySQL

Python作用域和名称空间的详细介绍

2022/04/13 Python