Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python常用的文件及文件路径、目录操作方法汇总介绍
May 21 Python
Python实战小程序利用matplotlib模块画图代码分享
Dec 09 Python
django静态文件加载的方法
May 20 Python
python 将md5转为16字节的方法
May 29 Python
python进行TCP端口扫描的实现
Dec 21 Python
Django 日志配置按日期滚动的方法
Jan 31 Python
对Python3使运行暂停的方法详解
Feb 18 Python
如何使用python爬虫爬取要登陆的网站
Jul 12 Python
python2 中 unicode 和 str 之间的转换及与python3 str 的区别
Jul 25 Python
python系统指定文件的查找只输出目录下所有文件及文件夹
Jan 19 Python
一文了解python 3 字符串格式化 F-string 用法
Mar 04 Python
关于python 跨域处理方式详解
Mar 28 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
php构造函数实例讲解
2013/11/13 PHP
PHP面向对象继承用法详解(优化与减少代码重复)
2016/12/02 PHP
tp5(thinkPHP5)框架数据库Db增删改查常见操作总结
2019/01/10 PHP
jquery对表单操作2
2011/04/06 Javascript
jquery 中多条件选择器,相对选择器,层次选择器的区别
2012/07/03 Javascript
基于jQuery实现网页进度显示插件
2015/03/04 Javascript
JavaScript取得WEB安全颜色列表的方法
2015/07/14 Javascript
jQuery实现简单的文件上传进度条效果
2020/03/26 Javascript
学习javascript面向对象 掌握创建对象的9种方式
2016/01/04 Javascript
在Linux系统中搭建Node.js开发环境的简单步骤讲解
2016/01/26 Javascript
JavaScript编程中实现对象封装特性的实例讲解
2016/06/24 Javascript
Angular.Js的自动化测试详解
2016/12/09 Javascript
bootstrap table之通用方法( 时间控件,导出,动态下拉框, 表单验证 ,选中与获取信息)代码分享
2017/01/24 Javascript
Bootstrap的Carousel配合dropload.js实现移动端滑动切换图片
2017/03/10 Javascript
jquery实现图片上传前本地预览
2017/04/28 jQuery
浅谈关于angularJs中使用$.ajax的注意点
2017/08/12 Javascript
详解微信小程序的 request 封装示例
2018/08/21 Javascript
vue2 设置router-view默认路径的实例
2018/09/20 Javascript
详解vue2.0模拟后台json数据
2019/05/16 Javascript
Vue el-autocomplete远程搜索下拉框并实现自动填充功能(推荐)
2019/10/25 Javascript
[02:50]【扭转乾坤,只此一招】DOTA2全新版本永雾林渊开启新篇章
2020/12/24 DOTA
python通过pip更新所有已安装的包实现方法
2017/05/19 Python
python 通过类中一个方法获取另一个方法变量的实例
2019/01/22 Python
使用python和pygame制作挡板弹球游戏
2019/12/03 Python
python按照list中字典的某key去重的示例代码
2020/10/13 Python
python 爬虫基本使用——统计杭电oj题目正确率并排序
2020/10/26 Python
python 实现图片修复(可用于去水印)
2020/11/19 Python
HTML5拖拽的简单实例
2016/05/30 HTML / CSS
canvas画图被放大且模糊的解决方法
2020/08/11 HTML / CSS
Cocopanda波兰:购买化妆品、护肤品、护发和香水
2020/05/25 全球购物
教师年终个人自我评价
2013/10/04 职场文书
2014年保卫部工作总结
2014/11/21 职场文书
2015年董事长秘书工作总结
2015/07/23 职场文书
2015年安全生产月工作总结
2015/07/27 职场文书
灵能百分百第三季什么时候来?
2022/03/15 日漫
Android开发手册自定义Switch开关按钮控件
2022/06/10 Java/Android