Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的一些用法分享
Oct 07 Python
python网络编程实例简析
Sep 26 Python
Python输入二维数组方法
Apr 13 Python
解决Python 命令行执行脚本时,提示导入的包找不到的问题
Jan 19 Python
使用python 写一个静态服务(实战)
Jun 28 Python
Django中信号signals的简单使用方法
Jul 04 Python
pip 安装库比较慢的解决方法(国内镜像)
Oct 06 Python
Django+Celery实现动态配置定时任务的方法示例
May 26 Python
浅谈tensorflow 中的图片读取和裁剪方式
Jun 30 Python
python实现简易自习室座位预约系统
Jun 30 Python
Python中非常使用的6种基本变量的操作与技巧
Mar 22 Python
Python爬取奶茶店数据分析哪家最好喝以及性价比
Sep 23 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
PHP表单提交表单名称含有点号(.)则会被转化为下划线(_)
2011/12/14 PHP
php实现webservice实例
2014/11/06 PHP
PHP间隔一段时间执行代码的方法
2014/12/02 PHP
PHP 设计模式系列之 specification规格模式
2016/01/10 PHP
PHP数据库操作Helper类完整实例
2016/05/11 PHP
CI框架无限级分类+递归的实现代码
2016/11/01 PHP
JS 拼图游戏 面向对象,注释完整。
2009/06/18 Javascript
一段批量给页面上的控件赋值js
2010/06/19 Javascript
基于jquery的实现简单的表格中增加或删除下一行
2010/08/01 Javascript
js中通过split函数分割字符串成数组小例子
2013/09/21 Javascript
jquery遍历checkbox介绍
2014/02/21 Javascript
JavaScript调用客户端Java程序的方法
2015/07/27 Javascript
jQuery中bind(),live(),delegate(),on()绑定事件方法实例详解
2016/01/19 Javascript
基于AngularJS+HTML+Groovy实现登录功能
2016/02/17 Javascript
JavaScript中数组去除重复的三种方法
2016/04/22 Javascript
jQuery实现模糊搜索功能的方法分析
2018/06/29 jQuery
Vue 实现显示/隐藏层的思路(加全局点击事件)
2019/12/31 Javascript
javascript设计模式 ? 职责链模式原理与用法实例分析
2020/04/16 Javascript
[01:05:07]DOTA2-DPC中国联赛 正赛 DLG vs Dragon BO3 第一场2月1日
2021/03/11 DOTA
python生成随机密码或随机字符串的方法
2015/07/03 Python
python logging重复记录日志问题的解决方法
2018/07/12 Python
python re库的正则表达式入门学习教程
2019/03/08 Python
python实现kmp算法的实例代码
2019/04/03 Python
Python partial函数原理及用法解析
2019/12/11 Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
2021/02/20 Python
CSS3 :default伪类选择器使用简介
2018/03/15 HTML / CSS
工程造价管理专业大专生求职信
2013/10/06 职场文书
体育教师自荐信范文
2013/12/16 职场文书
烹调加工管理制度
2014/02/04 职场文书
高校群众路线教育实践活动剖析材料
2014/10/10 职场文书
2014年安全员工作总结
2014/11/13 职场文书
借钱欠条怎么写
2015/07/03 职场文书
《语言的突破》读后感3篇
2019/12/12 职场文书
nginx内存池源码解析
2021/11/20 Servers
MySQL 执行数据库更新update操作的时候数据库卡死了
2022/05/02 MySQL
ssh服务器拒绝了密码 请再试一次已解决(亲测有效)
2022/08/14 Servers