python使用pandas实现数据分割实例代码


Posted in Python onJanuary 25, 2018

本文研究的主要是Python编程通过pandas将数据分割成时间跨度相等的数据块的相关内容,具体如下。

先上数据,有如下dataframe格式的数据,列名分别为date、ip,我需要统计每5s内出现的ip,以及这些ip出现的频数。

ip   date
0 127.0.0.21 15/Jul/2017:18:22:16
1 127.0.0.13 15/Jul/2017:18:22:16
2 127.0.0.11 15/Jul/2017:18:22:17
3 127.0.0.11 15/Jul/2017:18:22:20
4 127.0.0.21 15/Jul/2017:18:22:21
5 127.0.0.13 15/Jul/2017:18:22:22
6 127.0.0.14 15/Jul/2017:18:26:36
7 127.0.0.16 15/Jul/2017:18:32:15
8 127.0.0.11 15/Jul/2017:18:36:03

在网上找了很久但是没看到python的相关答案,但在stackoverflow找到了R语言的解法,有兴趣可以看看。

受它的启发,我用不太优雅的方式实现了我的需求,有更好解决方法的请不吝赐教:

step1: 将数据中日期格式变为标准格式

#date_ip为我的dataframe数据
date_ip['date'] = pd.to_datetime(date_ip['date'], format='%d/%b/%Y:%H:%M:%S')

step2: 将数据的开始时间、结束时间,按5s分割(由于时间段可能不是恰好是5s的倍数,为避免最后一个时间丢失,因此在最后加上5s)

frequency = 5
time_range = pd.date_range(date_ip['date'][0],
    date_ip['date'][date_ip.shape[0]-1]
    +frequency*Second(), freq='%sS'%frequency)

step3: 将date变为索引

date_ip = date_ip.set_index('date')

step4: 对每个时间段内的数据进行频数计算(由于通过标签切片时会包含头、尾数据,为避免重复计算,因此在尾部减1s)

for i in xrange(0,len(time_range)-1):
 print get_frequency(date_ip.loc[time_range[i]:time_range[i+1]-1*Second()])

完整的代码

import pandas as pd
from pandas.tseries.offsets import Second
def get_frequency(date_ip):
 ip_frequency = {}
 for i in xrange(0,date_ip.shape[0]):
 ip_frequency[date_ip['ip'][i]] = ip_frequency.get(date_ip['ip'][i], 0) + 1
 return ip_frequency,date_ip.shape[0]

if __name__ == '__main__': 
 date_ip['date'] = pd.to_datetime(date_ip['date'], format='%d/%b/%Y:%H:%M:%S')

 frequency = 5
 time_range = pd.date_range(date_ip['date'][0], date_ip['date'][date_ip.shape[0]-1]
    +frequency*Second(), freq='%sS'%frequency) 
 date_ip = date_ip.set_index('date')
 for i in xrange(0, len(time_range) - 1):
 print get_frequency(date_ip.loc[time_range[i]:time_range[i + 1]-1*Second()])

文章开头数据运行结果:

({'127.0.0.21' : 1, '127.0.0.13' : 1, '127.0.0.11' : 2}, 4)
({'127.0.0.21': 1, '127.0.0.13': 1}, 2)
({'127.0.0.14': 1}, 1)
({'127.0.0.16': 1}, 1)
({'127.0.0.11': 1}, 1)

总结

以上就是本文关于python使用pandas实现数据分割实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
400多行Python代码实现了一个FTP服务器
May 10 Python
使用Python对MySQL数据操作
Apr 06 Python
Python自定义装饰器原理与用法实例分析
Jul 16 Python
python对文件目录的操作方法实例总结
Jun 24 Python
django-crontab 定时执行任务方法的实现
Sep 06 Python
导入tensorflow:ImportError: libcublas.so.9.0 报错
Jan 06 Python
Python Des加密解密如何实现软件注册码机器码
Jan 08 Python
Python GUI库PyQt5图形和特效样式QSS介绍
Feb 25 Python
python实现密度聚类(模板代码+sklearn代码)
Apr 27 Python
keras实现多种分类网络的方式
Jun 11 Python
python常见的占位符总结及用法
Jul 02 Python
python工具dtreeviz决策树可视化和模型可解释性
Mar 03 Python
python实现闹钟定时播放音乐功能
Jan 25 #Python
python实现壁纸批量下载代码实例
Jan 25 #Python
python命令行解析之parse_known_args()函数和parse_args()使用区别介绍
Jan 24 #Python
Python动刷新抢12306火车票的代码(附源码)
Jan 24 #Python
python中的set实现不重复的排序原理
Jan 24 #Python
详解Python之unittest单元测试代码
Jan 24 #Python
python爬取拉勾网职位数据的方法
Jan 24 #Python
You might like
php设计模式小结
2013/02/15 PHP
PHP实现的简单三角形、矩形周长面积计算器分享
2014/11/18 PHP
Yii+upload实现AJAX上传图片的方法
2016/07/13 PHP
php使用FFmpeg接口获取视频的播放时长、码率、缩略图以及创建时间
2016/11/07 PHP
浅谈PHP实现大流量下抢购方案
2017/12/15 PHP
更优雅的事件触发兼容
2011/10/24 Javascript
JS实现很酷的水波文字特效实例
2015/02/26 Javascript
通过实例理解javascript中没有函数重载的概念
2015/06/03 Javascript
jQuery实现表格行上下移动和置顶效果
2015/06/05 Javascript
Javascript验证Visa和MasterCard信用卡号的方法
2015/07/27 Javascript
AngularJS基础 ng-init 指令简单示例
2016/08/02 Javascript
JavaScript 函数模式详解及示例
2016/09/07 Javascript
Vue2.0使用过程常见的一些问题总结学习
2017/04/10 Javascript
js移动端图片压缩上传功能
2020/08/18 Javascript
详解vue中点击空白处隐藏div的实现(用指令实现)
2018/04/19 Javascript
javascript中的offsetWidth、clientWidth、innerWidth及相关属性方法
2020/05/14 Javascript
vue实现折线图 可按时间查询
2020/08/21 Javascript
详解vue-router的导航钩子(导航守卫)
2020/11/02 Javascript
python在linux中输出带颜色的文字的方法
2014/06/19 Python
python通过字典dict判断指定键值是否存在的方法
2015/03/21 Python
python 打印出所有的对象/模块的属性(实例代码)
2016/09/11 Python
PyCharm的设置方法和第一个Python程序的建立
2019/01/16 Python
Python 微信爬虫完整实例【单线程与多线程】
2019/07/06 Python
Python 实现递归法解决迷宫问题的示例代码
2020/01/12 Python
python使用建议与技巧分享(二)
2020/08/17 Python
劳力士官方珠宝商:J.R. Dunn Jewelers
2018/09/29 全球购物
Lululemon英国官网:加拿大瑜伽服装品牌
2019/01/14 全球购物
英文版餐饮业求职信
2013/10/18 职场文书
函授本科自我鉴定
2013/11/03 职场文书
家长对小学生的评语
2014/01/28 职场文书
纠纷协议书
2014/04/16 职场文书
销售竞赛活动方案
2014/08/23 职场文书
群众路线问题查摆对照检查材料
2014/10/04 职场文书
MySQL表的增删改查(基础)
2021/04/05 MySQL
浅谈python数据类型及其操作
2021/05/25 Python
叶县这家生产军用电台的兵工厂,人称“四机部”,走出一上将
2022/02/18 无线电