Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python pdb调试方法分享
Jan 21 Python
python控制台显示时钟的示例
Feb 24 Python
python实现多线程采集的2个代码例子
Jul 07 Python
python 3.0 模拟用户登录功能并实现三次错误锁定
Nov 01 Python
python与sqlite3实现解密chrome cookie实例代码
Jan 20 Python
python使用Flask操作mysql实现登录功能
May 14 Python
Python中turtle库的使用实例
Sep 09 Python
Python 经典算法100及解析(小结)
Sep 13 Python
Python操作多维数组输出和矩阵运算示例
Nov 28 Python
pytorch AvgPool2d函数使用详解
Jan 03 Python
PyTorch的SoftMax交叉熵损失和梯度用法
Jan 15 Python
Python 实现网课实时监控自动签到、打卡功能
Mar 12 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
php flv视频时间获取函数
2010/06/29 PHP
PHP开发负载均衡指南
2010/07/17 PHP
php笔记之:初探PHPcms模块开发介绍
2013/04/26 PHP
如何设置mysql允许外网访问
2013/06/04 PHP
解析smarty 截取字符串函数 truncate的用法介绍
2013/06/20 PHP
PHP生成静态HTML页面最简单方法示例
2015/04/09 PHP
php+redis实现注册、删除、编辑、分页、登录、关注等功能示例
2017/02/15 PHP
ThinkPHP实现分页功能
2017/04/28 PHP
JavaScript Event学习第三章 早期的事件处理程序
2010/02/07 Javascript
Thinkphp模板没有解析直接原样输出的解决方法
2014/10/31 Javascript
老生常谈Javascript中的原型和this指针
2016/10/09 Javascript
jquery css实现邮箱自动补全
2016/11/14 Javascript
vue如何引用其他组件(css和js)
2017/04/13 Javascript
JavaScript实现鼠标滚轮控制页面图片切换功能示例
2017/10/14 Javascript
微信小程序版翻牌小游戏
2018/01/26 Javascript
vue.js实现的经典计算器/科学计算器功能示例
2018/07/11 Javascript
jQuery实现checkbox全选功能完整实例
2018/07/12 jQuery
解决Vue2.0中使用less给元素添加背景图片出现的问题
2018/09/03 Javascript
bootstrap table合并行数据并居中对齐效果
2018/10/17 Javascript
Koa日志中间件封装开发详解
2019/03/09 Javascript
uni-app从安装到卸载的入门教程
2020/05/15 Javascript
js制作提示框插件
2020/12/24 Javascript
Numpy中的mask的使用
2018/07/21 Python
Python3利用Dlib实现摄像头实时人脸检测和平铺显示示例
2019/02/21 Python
django框架F&amp;Q 聚合与分组操作示例
2019/12/12 Python
Python @property原理解析和用法实例
2020/02/11 Python
Tkinter中复选菜单是否被选中的判断与设置方式
2020/03/04 Python
Python爬虫与反爬虫大战
2020/07/30 Python
python的launcher用法知识点总结
2020/08/07 Python
Html5监听手机摇一摇事件的实现
2019/11/07 HTML / CSS
利用Node实现HTML5离线存储的方法
2020/10/16 HTML / CSS
PHP如何去执行一个SQL语句
2016/03/05 面试题
大学生个人总结的自我评价
2013/10/05 职场文书
小学教师事迹材料
2014/01/13 职场文书
万年牢教学反思
2014/02/15 职场文书
运动会拉拉队口号
2014/06/09 职场文书