python使用pandas实现数据分割实例代码


Posted in Python onJanuary 25, 2018

本文研究的主要是Python编程通过pandas将数据分割成时间跨度相等的数据块的相关内容,具体如下。

先上数据,有如下dataframe格式的数据,列名分别为date、ip,我需要统计每5s内出现的ip,以及这些ip出现的频数。

ip   date
0 127.0.0.21 15/Jul/2017:18:22:16
1 127.0.0.13 15/Jul/2017:18:22:16
2 127.0.0.11 15/Jul/2017:18:22:17
3 127.0.0.11 15/Jul/2017:18:22:20
4 127.0.0.21 15/Jul/2017:18:22:21
5 127.0.0.13 15/Jul/2017:18:22:22
6 127.0.0.14 15/Jul/2017:18:26:36
7 127.0.0.16 15/Jul/2017:18:32:15
8 127.0.0.11 15/Jul/2017:18:36:03

在网上找了很久但是没看到python的相关答案,但在stackoverflow找到了R语言的解法,有兴趣可以看看。

受它的启发,我用不太优雅的方式实现了我的需求,有更好解决方法的请不吝赐教:

step1: 将数据中日期格式变为标准格式

#date_ip为我的dataframe数据
date_ip['date'] = pd.to_datetime(date_ip['date'], format='%d/%b/%Y:%H:%M:%S')

step2: 将数据的开始时间、结束时间,按5s分割(由于时间段可能不是恰好是5s的倍数,为避免最后一个时间丢失,因此在最后加上5s)

frequency = 5
time_range = pd.date_range(date_ip['date'][0],
    date_ip['date'][date_ip.shape[0]-1]
    +frequency*Second(), freq='%sS'%frequency)

step3: 将date变为索引

date_ip = date_ip.set_index('date')

step4: 对每个时间段内的数据进行频数计算(由于通过标签切片时会包含头、尾数据,为避免重复计算,因此在尾部减1s)

for i in xrange(0,len(time_range)-1):
 print get_frequency(date_ip.loc[time_range[i]:time_range[i+1]-1*Second()])

完整的代码

import pandas as pd
from pandas.tseries.offsets import Second
def get_frequency(date_ip):
 ip_frequency = {}
 for i in xrange(0,date_ip.shape[0]):
 ip_frequency[date_ip['ip'][i]] = ip_frequency.get(date_ip['ip'][i], 0) + 1
 return ip_frequency,date_ip.shape[0]

if __name__ == '__main__': 
 date_ip['date'] = pd.to_datetime(date_ip['date'], format='%d/%b/%Y:%H:%M:%S')

 frequency = 5
 time_range = pd.date_range(date_ip['date'][0], date_ip['date'][date_ip.shape[0]-1]
    +frequency*Second(), freq='%sS'%frequency) 
 date_ip = date_ip.set_index('date')
 for i in xrange(0, len(time_range) - 1):
 print get_frequency(date_ip.loc[time_range[i]:time_range[i + 1]-1*Second()])

文章开头数据运行结果:

({'127.0.0.21' : 1, '127.0.0.13' : 1, '127.0.0.11' : 2}, 4)
({'127.0.0.21': 1, '127.0.0.13': 1}, 2)
({'127.0.0.14': 1}, 1)
({'127.0.0.16': 1}, 1)
({'127.0.0.11': 1}, 1)

总结

以上就是本文关于python使用pandas实现数据分割实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 Python
浅述python2与python3的简单区别
Sep 19 Python
对python 自定义协议的方法详解
Feb 13 Python
python 批量添加的button 使用同一点击事件的方法
Jul 17 Python
python实现的读取网页并分词功能示例
Oct 29 Python
Python实现栈和队列的简单操作方法示例
Nov 29 Python
在 Python 中接管键盘中断信号的实现方法
Feb 04 Python
使用Python开发个京东上抢口罩的小实例(仅作技术研究学习使用)
Mar 10 Python
Python 如何在字符串中插入变量
Aug 01 Python
Python djanjo之csrf防跨站攻击实验过程
May 14 Python
Python使用protobuf序列化和反序列化的实现
May 19 Python
Python实现的扫码工具居然这么好用!
Jun 07 Python
python实现闹钟定时播放音乐功能
Jan 25 #Python
python实现壁纸批量下载代码实例
Jan 25 #Python
python命令行解析之parse_known_args()函数和parse_args()使用区别介绍
Jan 24 #Python
Python动刷新抢12306火车票的代码(附源码)
Jan 24 #Python
python中的set实现不重复的排序原理
Jan 24 #Python
详解Python之unittest单元测试代码
Jan 24 #Python
python爬取拉勾网职位数据的方法
Jan 24 #Python
You might like
异世界新番又来了,同样是从零开始,男主的年龄降到5岁
2020/04/09 日漫
Laravel 5框架学习之环境与配置
2015/04/08 PHP
解读PHP中的垃圾回收机制
2015/08/10 PHP
PHP实现的登录,注册及密码修改功能分析
2016/11/25 PHP
Yii2下点击验证码的切换实例代码
2017/03/14 PHP
php7 图形用户界面GUI 开发示例
2020/02/22 PHP
jquery引用方法时传递参数原理分析
2014/10/13 Javascript
使用jquery菜单插件HoverTree仿京东无限级菜单
2014/12/18 Javascript
分享一则JavaScript滚动条插件源码
2015/03/03 Javascript
js生成随机数的过程解析
2015/11/24 Javascript
JavaScript学习小结之使用canvas画“哆啦A梦”时钟
2016/07/24 Javascript
微信小程序 网络API 上传、下载详解
2016/11/09 Javascript
Vue.js之slot深度复制详解
2017/03/10 Javascript
解决vue props 拿不到值的问题
2018/09/11 Javascript
详解SPA中前端路由基本原理与实现方式
2018/09/12 Javascript
vue全屏事件开发详解
2020/06/17 Javascript
Python中关键字is与==的区别简述
2014/07/31 Python
python使用chardet判断字符串编码的方法
2015/03/13 Python
Python运算符重载用法实例分析
2015/06/01 Python
Python实现的下载网页源码功能示例
2017/06/13 Python
Python绘制七段数码管实例代码
2017/12/20 Python
python生成密码字典的方法
2018/07/06 Python
python操作小程序云数据库实现简单的增删改查功能
2019/06/06 Python
Python logging设置和logger解析
2019/08/28 Python
Django中使用MySQL5.5的教程
2019/12/18 Python
Python3使用 GitLab API 进行批量合并分支
2020/10/15 Python
英国手工制作的现代与经典的沙发和床:Love Your Home
2020/09/26 全球购物
绝对经典成功的大学生推荐信
2013/11/08 职场文书
工程安全员岗位职责
2014/03/09 职场文书
公司新年寄语
2014/04/04 职场文书
暑期培训心得体会
2014/09/02 职场文书
网球场地租赁协议范本
2014/10/07 职场文书
学校财务管理制度
2015/08/04 职场文书
教师旷工检讨书
2015/08/15 职场文书
原来闭幕词是这样写的呀!
2019/07/01 职场文书
MySQL表的增删改查基础教程
2021/04/07 MySQL