Python 数据的累加与统计的示例代码


Posted in Python onAugust 03, 2020

问题

你需要处理一个很大的数据集并需要计算数据总和或其他统计量。

解决方案

对于任何涉及到统计、时间序列以及其他相关技术的数据分析问题,都可以考虑使用 Pandas库 。

为了让你先体验下,下面是一个使用Pandas来分析芝加哥城市的 老鼠和啮齿类动物数据库 的例子。 在我写这篇文章的时候,这个数据库是一个拥有大概74,000行数据的CSV文件。

>>> import pandas

>>> # Read a CSV file, skipping last line
>>> rats = pandas.read_csv('rats.csv', skip_footer=1)
>>> rats
<class 'pandas.core.frame.DataFrame'>
Int64Index: 74055 entries, 0 to 74054
Data columns:
Creation Date 74055 non-null values
Status 74055 non-null values
Completion Date 72154 non-null values
Service Request Number 74055 non-null values
Type of Service Request 74055 non-null values
Number of Premises Baited 65804 non-null values
Number of Premises with Garbage 65600 non-null values
Number of Premises with Rats 65752 non-null values
Current Activity 66041 non-null values
Most Recent Action 66023 non-null values
Street Address 74055 non-null values
ZIP Code 73584 non-null values
X Coordinate 74043 non-null values
Y Coordinate 74043 non-null values
Ward 74044 non-null values
Police District 74044 non-null values
Community Area 74044 non-null values
Latitude 74043 non-null values
Longitude 74043 non-null values
Location 74043 non-null values
dtypes: float64(11), object(9)

>>> # Investigate range of values for a certain field
>>> rats['Current Activity'].unique()
array([nan, Dispatch Crew, Request Sanitation Inspector], dtype=object)
>>> # Filter the data
>>> crew_dispatched = rats[rats['Current Activity'] == 'Dispatch Crew']
>>> len(crew_dispatched)
65676
>>>

>>> # Find 10 most rat-infested ZIP codes in Chicago
>>> crew_dispatched['ZIP Code'].value_counts()[:10]
60647 3837
60618 3530
60614 3284
60629 3251
60636 2801
60657 2465
60641 2238
60609 2206
60651 2152
60632 2071
>>>

>>> # Group by completion date
>>> dates = crew_dispatched.groupby('Completion Date')
<pandas.core.groupby.DataFrameGroupBy object at 0x10d0a2a10>
>>> len(dates)
472
>>>

>>> # Determine counts on each day
>>> date_counts = dates.size()
>>> date_counts[0:10]
Completion Date
01/03/2011 4
01/03/2012 125
01/04/2011 54
01/04/2012 38
01/05/2011 78
01/05/2012 100
01/06/2011 100
01/06/2012 58
01/07/2011 1
01/09/2012 12
>>>

>>> # Sort the counts
>>> date_counts.sort()
>>> date_counts[-10:]
Completion Date
10/12/2012 313
10/21/2011 314
09/20/2011 316
10/26/2011 319
02/22/2011 325
10/26/2012 333
03/17/2011 336
10/13/2011 378
10/14/2011 391
10/07/2011 457
>>>

嗯,看样子2011年10月7日对老鼠们来说是个很忙碌的日子啊!^_^

讨论

Pandas是一个拥有很多特性的大型函数库,我在这里不可能介绍完。 但是只要你需要去分析大型数据集合、对数据分组、计算各种统计量或其他类似任务的话,这个函数库真的值得你去看一看。

以上就是Python 数据的累加与统计的方法的详细内容,更多关于Python 数据的累加与统计的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
pyqt4教程之实现半透明的天气预报界面示例
Mar 02 Python
Python ORM框架SQLAlchemy学习笔记之数据添加和事务回滚介绍
Jun 10 Python
Python中的异常处理简明介绍
Apr 13 Python
Python PyQt5实现的简易计算器功能示例
Aug 23 Python
Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地
Feb 23 Python
python调用百度语音识别实现大音频文件语音识别功能
Aug 30 Python
python openCV获取人脸部分并存储功能
Aug 28 Python
Django中自定义模型管理器(Manager)及方法
Sep 23 Python
python/Matplotlib绘制复变函数图像教程
Nov 21 Python
在django admin中配置搜索域是一个外键时的处理方法
May 20 Python
python爬虫可以爬什么
Jun 16 Python
用python发送微信消息
Dec 21 Python
Python 爬虫性能相关总结
Aug 03 #Python
python接口自动化之ConfigParser配置文件的使用详解
Aug 03 #Python
Python 利用OpenCV给照片换底色的示例代码
Aug 03 #Python
Python3基于plotly模块保存图片表格
Aug 03 #Python
详解Python的爬虫框架 Scrapy
Aug 03 #Python
Python利用Faiss库实现ANN近邻搜索的方法详解
Aug 03 #Python
Python pexpect模块及shell脚本except原理解析
Aug 03 #Python
You might like
php使用Jpgraph创建柱状图展示年度收支表效果示例
2017/02/15 PHP
PHP常用字符串输出方法分析(echo,print,printf及sprintf)
2021/03/09 PHP
JavaScript版代码高亮
2006/06/26 Javascript
推荐:极酷右键菜单
2006/11/29 Javascript
统计出现最多的字符次数的js代码
2010/12/03 Javascript
js计算精度问题小结
2013/04/22 Javascript
jquery 图片缩放拖动的简单实例
2014/01/08 Javascript
javascript在网页中实现读取剪贴板粘贴截图功能
2014/06/07 Javascript
jquery中animate的stop()方法作用实例分析
2015/01/30 Javascript
基于jQuery实现的扇形定时器附源码下载
2015/10/20 Javascript
深入浅析JavaScript中的Function类型
2016/07/09 Javascript
Bootstrap对话框使用实例讲解
2016/09/24 Javascript
node.js平台下的mysql数据库配置及连接
2017/03/31 Javascript
JavaScript实现的数字与字符串转换功能示例
2017/08/23 Javascript
利用jsonp与代理服务器方案解决跨域问题
2017/09/14 Javascript
vue实现微信分享链接添加动态参数的方法
2019/04/29 Javascript
如何测量vue应用运行时的性能
2019/06/21 Javascript
vue中解决微信html5原生ios虚拟键返回不刷新问题
2020/10/20 Javascript
微信小程序将页面按钮悬浮固定在底部的实现代码
2020/10/29 Javascript
javascript实现拼图游戏
2021/01/29 Javascript
python使用PyFetion来发送短信的例子
2014/04/22 Python
浅谈Python中数据解析
2015/05/05 Python
Python PyQt5标准对话框用法示例
2017/08/23 Python
Python使用progressbar模块实现的显示进度条功能
2018/05/31 Python
numpy中矩阵合并的实例
2018/06/15 Python
python爬虫爬取微博评论案例详解
2019/03/27 Python
如何基于python生成list的所有的子集
2019/11/11 Python
解决pyshp UnicodeDecodeError的问题
2019/12/06 Python
Pycharm如何导入python文件及解决报错问题
2020/05/10 Python
Python应用实现双指数函数及拟合代码实例
2020/06/19 Python
爬虫代理的cookie如何生成运行
2020/09/22 Python
H5 meta小结(前端必看篇)
2016/08/24 HTML / CSS
会计岗位说明书
2014/07/29 职场文书
重阳节活动总结
2014/08/27 职场文书
Python一些基本的图像操作和处理总结
2021/06/23 Python
Python基于百度AI实现抓取表情包
2021/06/27 Python