Python 数据的累加与统计的示例代码


Posted in Python onAugust 03, 2020

问题

你需要处理一个很大的数据集并需要计算数据总和或其他统计量。

解决方案

对于任何涉及到统计、时间序列以及其他相关技术的数据分析问题,都可以考虑使用 Pandas库 。

为了让你先体验下,下面是一个使用Pandas来分析芝加哥城市的 老鼠和啮齿类动物数据库 的例子。 在我写这篇文章的时候,这个数据库是一个拥有大概74,000行数据的CSV文件。

>>> import pandas

>>> # Read a CSV file, skipping last line
>>> rats = pandas.read_csv('rats.csv', skip_footer=1)
>>> rats
<class 'pandas.core.frame.DataFrame'>
Int64Index: 74055 entries, 0 to 74054
Data columns:
Creation Date 74055 non-null values
Status 74055 non-null values
Completion Date 72154 non-null values
Service Request Number 74055 non-null values
Type of Service Request 74055 non-null values
Number of Premises Baited 65804 non-null values
Number of Premises with Garbage 65600 non-null values
Number of Premises with Rats 65752 non-null values
Current Activity 66041 non-null values
Most Recent Action 66023 non-null values
Street Address 74055 non-null values
ZIP Code 73584 non-null values
X Coordinate 74043 non-null values
Y Coordinate 74043 non-null values
Ward 74044 non-null values
Police District 74044 non-null values
Community Area 74044 non-null values
Latitude 74043 non-null values
Longitude 74043 non-null values
Location 74043 non-null values
dtypes: float64(11), object(9)

>>> # Investigate range of values for a certain field
>>> rats['Current Activity'].unique()
array([nan, Dispatch Crew, Request Sanitation Inspector], dtype=object)
>>> # Filter the data
>>> crew_dispatched = rats[rats['Current Activity'] == 'Dispatch Crew']
>>> len(crew_dispatched)
65676
>>>

>>> # Find 10 most rat-infested ZIP codes in Chicago
>>> crew_dispatched['ZIP Code'].value_counts()[:10]
60647 3837
60618 3530
60614 3284
60629 3251
60636 2801
60657 2465
60641 2238
60609 2206
60651 2152
60632 2071
>>>

>>> # Group by completion date
>>> dates = crew_dispatched.groupby('Completion Date')
<pandas.core.groupby.DataFrameGroupBy object at 0x10d0a2a10>
>>> len(dates)
472
>>>

>>> # Determine counts on each day
>>> date_counts = dates.size()
>>> date_counts[0:10]
Completion Date
01/03/2011 4
01/03/2012 125
01/04/2011 54
01/04/2012 38
01/05/2011 78
01/05/2012 100
01/06/2011 100
01/06/2012 58
01/07/2011 1
01/09/2012 12
>>>

>>> # Sort the counts
>>> date_counts.sort()
>>> date_counts[-10:]
Completion Date
10/12/2012 313
10/21/2011 314
09/20/2011 316
10/26/2011 319
02/22/2011 325
10/26/2012 333
03/17/2011 336
10/13/2011 378
10/14/2011 391
10/07/2011 457
>>>

嗯,看样子2011年10月7日对老鼠们来说是个很忙碌的日子啊!^_^

讨论

Pandas是一个拥有很多特性的大型函数库,我在这里不可能介绍完。 但是只要你需要去分析大型数据集合、对数据分组、计算各种统计量或其他类似任务的话,这个函数库真的值得你去看一看。

以上就是Python 数据的累加与统计的方法的详细内容,更多关于Python 数据的累加与统计的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python基于twisted实现简单的web服务器
Sep 29 Python
深入浅析python继承问题
May 29 Python
查看Django和flask版本的方法
May 14 Python
python中plot实现即时数据动态显示方法
Jun 22 Python
Python实现的txt文件去重功能示例
Jul 07 Python
Python类的继承用法示例
Jan 31 Python
python 多线程对post请求服务器测试并发的方法
Jun 13 Python
在Pandas中处理NaN值的方法
Jun 25 Python
tesserocr与pytesseract模块的使用方法解析
Aug 30 Python
学习Python列表的基础知识汇总
Mar 10 Python
基于Python-turtle库绘制路飞的草帽骷髅旗、美国队长的盾牌、高达的源码
Feb 18 Python
pytorch中的model=model.to(device)使用说明
May 24 Python
Python 爬虫性能相关总结
Aug 03 #Python
python接口自动化之ConfigParser配置文件的使用详解
Aug 03 #Python
Python 利用OpenCV给照片换底色的示例代码
Aug 03 #Python
Python3基于plotly模块保存图片表格
Aug 03 #Python
详解Python的爬虫框架 Scrapy
Aug 03 #Python
Python利用Faiss库实现ANN近邻搜索的方法详解
Aug 03 #Python
Python pexpect模块及shell脚本except原理解析
Aug 03 #Python
You might like
Discuz 5.0 中读取纯真IP数据库函数分析
2007/03/16 PHP
PHP利用MySQL保存session的实现思路及示例代码
2014/09/09 PHP
php实现汉字验证码和算式验证码的方法
2015/03/07 PHP
php版微信小店API二次开发及使用示例
2016/11/12 PHP
Laravel中log无法写入问题的解决
2017/06/17 PHP
Yii2.0实现生成二维码功能实例
2017/10/24 PHP
使用prototype.js进行异步操作
2007/02/07 Javascript
jquery下动态显示jqGrid以及jqGrid的属性设置容易出现问题的解决方法
2010/10/22 Javascript
Javascript学习笔记之 函数篇(二) : this 的工作机制
2014/06/24 Javascript
JavaScript数组常用操作技巧汇总
2014/11/17 Javascript
JS实现为表格动态添加标题的方法
2015/03/31 Javascript
js实现刷新页面后回到记录时滚动条的位置【两种方案可选】
2016/12/12 Javascript
jQuery的中 is(':visible') 解析及用法(必看)
2017/02/12 Javascript
JavaScript实现星星等级评价功能
2017/03/22 Javascript
js合并两个数组生成合并后的key:value数组
2018/05/09 Javascript
vue实现简单的日历效果
2020/09/24 Javascript
vue 实现移动端键盘搜索事件监听
2019/11/06 Javascript
Python的Django框架使用入门指引
2015/04/15 Python
python简单操作excle的方法
2018/09/12 Python
使用python采集脚本之家电子书资源并自动下载到本地的实例脚本
2018/10/23 Python
Python饼状图的绘制实例
2019/01/15 Python
Python Flask 搭建微信小程序后台详解
2019/05/06 Python
Python 实现大整数乘法算法的示例代码
2019/09/17 Python
python os.path.isfile()因参数问题判断错误的解决
2019/11/29 Python
python对XML文件的操作实现代码
2020/03/27 Python
英国50岁以上人群的交友网站:Ourtime
2018/03/28 全球购物
WWE美国职业摔角官方商店:WWE Shop
2018/11/15 全球购物
澳大利亚婴儿、幼儿和儿童在线设计师商店:Smooch Baby
2019/02/16 全球购物
纪念建党演讲稿范文
2014/01/13 职场文书
十岁生日父母答谢词
2014/01/18 职场文书
1亿有多大教学反思
2014/05/01 职场文书
邻里守望志愿服务活动方案
2014/08/15 职场文书
聘任书格式及范文
2015/09/21 职场文书
队名及霸气口号大全
2015/12/25 职场文书
spring项目中切面及AOP的使用方法
2021/06/26 Java/Android
Golang解析JSON对象
2022/04/30 Golang