Python 数据的累加与统计的示例代码


Posted in Python onAugust 03, 2020

问题

你需要处理一个很大的数据集并需要计算数据总和或其他统计量。

解决方案

对于任何涉及到统计、时间序列以及其他相关技术的数据分析问题,都可以考虑使用 Pandas库 。

为了让你先体验下,下面是一个使用Pandas来分析芝加哥城市的 老鼠和啮齿类动物数据库 的例子。 在我写这篇文章的时候,这个数据库是一个拥有大概74,000行数据的CSV文件。

>>> import pandas

>>> # Read a CSV file, skipping last line
>>> rats = pandas.read_csv('rats.csv', skip_footer=1)
>>> rats
<class 'pandas.core.frame.DataFrame'>
Int64Index: 74055 entries, 0 to 74054
Data columns:
Creation Date 74055 non-null values
Status 74055 non-null values
Completion Date 72154 non-null values
Service Request Number 74055 non-null values
Type of Service Request 74055 non-null values
Number of Premises Baited 65804 non-null values
Number of Premises with Garbage 65600 non-null values
Number of Premises with Rats 65752 non-null values
Current Activity 66041 non-null values
Most Recent Action 66023 non-null values
Street Address 74055 non-null values
ZIP Code 73584 non-null values
X Coordinate 74043 non-null values
Y Coordinate 74043 non-null values
Ward 74044 non-null values
Police District 74044 non-null values
Community Area 74044 non-null values
Latitude 74043 non-null values
Longitude 74043 non-null values
Location 74043 non-null values
dtypes: float64(11), object(9)

>>> # Investigate range of values for a certain field
>>> rats['Current Activity'].unique()
array([nan, Dispatch Crew, Request Sanitation Inspector], dtype=object)
>>> # Filter the data
>>> crew_dispatched = rats[rats['Current Activity'] == 'Dispatch Crew']
>>> len(crew_dispatched)
65676
>>>

>>> # Find 10 most rat-infested ZIP codes in Chicago
>>> crew_dispatched['ZIP Code'].value_counts()[:10]
60647 3837
60618 3530
60614 3284
60629 3251
60636 2801
60657 2465
60641 2238
60609 2206
60651 2152
60632 2071
>>>

>>> # Group by completion date
>>> dates = crew_dispatched.groupby('Completion Date')
<pandas.core.groupby.DataFrameGroupBy object at 0x10d0a2a10>
>>> len(dates)
472
>>>

>>> # Determine counts on each day
>>> date_counts = dates.size()
>>> date_counts[0:10]
Completion Date
01/03/2011 4
01/03/2012 125
01/04/2011 54
01/04/2012 38
01/05/2011 78
01/05/2012 100
01/06/2011 100
01/06/2012 58
01/07/2011 1
01/09/2012 12
>>>

>>> # Sort the counts
>>> date_counts.sort()
>>> date_counts[-10:]
Completion Date
10/12/2012 313
10/21/2011 314
09/20/2011 316
10/26/2011 319
02/22/2011 325
10/26/2012 333
03/17/2011 336
10/13/2011 378
10/14/2011 391
10/07/2011 457
>>>

嗯,看样子2011年10月7日对老鼠们来说是个很忙碌的日子啊!^_^

讨论

Pandas是一个拥有很多特性的大型函数库,我在这里不可能介绍完。 但是只要你需要去分析大型数据集合、对数据分组、计算各种统计量或其他类似任务的话,这个函数库真的值得你去看一看。

以上就是Python 数据的累加与统计的方法的详细内容,更多关于Python 数据的累加与统计的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python 数据加密代码
Dec 24 Python
python文件操作整理汇总
Oct 21 Python
python让图片按照exif信息里的创建时间进行排序的方法
Mar 16 Python
实例Python处理XML文件的方法
Aug 31 Python
TensorFlow 模型载入方法汇总(小结)
Jun 19 Python
pandas 根据列的值选取所有行的示例
Nov 07 Python
详解Python传入参数的几种方法
May 16 Python
Python彻底删除文件夹及其子文件方式
Dec 23 Python
python判断两个序列的成员是否一样的实例代码
Mar 01 Python
python3实现往mysql中插入datetime类型的数据
Mar 02 Python
matplotlib.pyplot.matshow 矩阵可视化实例
Jun 16 Python
python 爬虫网页登陆的简单实现
Nov 30 Python
Python 爬虫性能相关总结
Aug 03 #Python
python接口自动化之ConfigParser配置文件的使用详解
Aug 03 #Python
Python 利用OpenCV给照片换底色的示例代码
Aug 03 #Python
Python3基于plotly模块保存图片表格
Aug 03 #Python
详解Python的爬虫框架 Scrapy
Aug 03 #Python
Python利用Faiss库实现ANN近邻搜索的方法详解
Aug 03 #Python
Python pexpect模块及shell脚本except原理解析
Aug 03 #Python
You might like
PHP实现的DES加密解密类定义与用法示例
2020/11/02 PHP
几款极品的javascript压缩混淆工具
2007/05/16 Javascript
javascript 面向对象编程 function也是类
2009/09/17 Javascript
js中confirm实现执行操作前弹出确认框的方法
2014/11/01 Javascript
浅谈Sizzle的“编译原理”
2015/04/14 Javascript
js实现日历与定时器
2017/02/22 Javascript
深入理解JavaScript 中的匿名函数((function() {})();)与变量的作用域
2018/08/28 Javascript
Vue中遍历数组的新方法实例详解
2019/07/21 Javascript
微信小程序工具函数封装
2019/10/28 Javascript
javascript-hashchange事件和历史状态管理实例分析
2020/04/18 Javascript
vue 实现在同一界面实现组件的动态添加和删除功能
2020/06/16 Javascript
小程序实现简单语音聊天的示例代码
2020/07/24 Javascript
vue+vuex+axios从后台获取数据存入vuex,组件之间共享数据操作
2020/07/31 Javascript
零基础写python爬虫之使用urllib2组件抓取网页内容
2014/11/04 Python
Python自动发送邮件的方法实例总结
2018/12/08 Python
Python使用while循环花式打印乘法表
2019/01/28 Python
pyqt5移动鼠标显示坐标的方法
2019/06/21 Python
浅谈Django+Gunicorn+Nginx部署之路
2019/09/11 Python
python 通过手机号识别出对应的微信性别(实例代码)
2019/12/22 Python
Python偏函数实现原理及应用
2020/11/20 Python
Simons官方网站:加拿大时尚零售商
2020/02/20 全球购物
高级护理实习生自荐信
2013/09/28 职场文书
自荐信怎么写好
2013/11/11 职场文书
晚会主持词开场白
2014/03/17 职场文书
公司聘任书模板
2014/03/29 职场文书
学校募捐倡议书
2014/05/14 职场文书
2014年幼儿园小班工作总结
2014/12/04 职场文书
企业2014年度工作总结
2014/12/10 职场文书
读后感作文评语
2014/12/25 职场文书
置业顾问岗位职责
2015/02/09 职场文书
写给老师的保证书
2015/05/09 职场文书
正规借条模板
2015/05/26 职场文书
2016年党员公开承诺书范文
2016/03/24 职场文书
关于Mybatis中SQL节点的深入解析
2022/03/19 Java/Android
《勇者辞职不干了》上卷BD发售宣传CM公开
2022/04/08 日漫
SQL中的连接查询详解
2022/06/21 SQL Server