Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
发布你的Python模块详解
Sep 15 Python
Python基于回溯法子集树模板解决野人与传教士问题示例
Sep 11 Python
教你用Python创建微信聊天机器人
Mar 31 Python
PyQt5每天必学之QSplitter实现窗口分隔
Apr 19 Python
详解通过API管理或定制开发ECS实例
Sep 30 Python
Python根据欧拉角求旋转矩阵的实例
Jan 28 Python
python excel转换csv代码实例
Aug 26 Python
python实现的汉诺塔算法示例
Oct 23 Python
python3 正则表达式基础廖雪峰
Mar 25 Python
python新手学习使用库
Jun 11 Python
详解使用Python写一个向数据库填充数据的小工具(推荐)
Sep 11 Python
python学习之panda数据分析核心支持库
May 07 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
php实现utf-8和GB2312编码相互转换函数代码
2013/02/07 PHP
PHP中实现Bloom Filter算法
2015/03/30 PHP
Yii中的cookie的发送和读取
2016/07/27 PHP
javascript 数据类型转换(parseInt,parseFloat)
2010/07/20 Javascript
Javascript 倒计时源代码.(时.分.秒) 详细注释版
2011/05/09 Javascript
jquery遍历之parent()和parents()的区别及parentsUntil()方法详解
2013/12/02 Javascript
jQuery中[attribute!=value]选择器用法实例
2014/12/31 Javascript
jquery中map函数遍历数组用法实例
2015/05/18 Javascript
jQuery实现返回顶部效果的方法
2015/05/29 Javascript
AngularJS+Node.js实现在线聊天室
2015/08/28 Javascript
JS实用的带停顿的逐行文本循环滚动效果实例
2016/11/23 Javascript
使用vue.js编写蓝色拼图小游戏
2017/03/17 Javascript
AngularJS中$http的交互问题
2017/03/29 Javascript
浅谈基于Vue.js的移动组件库cube-ui
2017/12/20 Javascript
vue 简单自动补全的输入框的示例
2018/03/12 Javascript
微信小程序有旋转动画效果的音乐组件实例代码
2018/08/22 Javascript
vue.js引入外部CSS样式和外部JS文件的方法
2019/01/06 Javascript
原生js实现随机点餐效果
2019/12/10 Javascript
vue使用exif获取图片旋转,压缩的示例代码
2020/12/11 Vue.js
Python SqlAlchemy动态添加数据表字段实例解析
2018/02/07 Python
Python中的函数式编程:不可变的数据结构
2018/10/08 Python
python中多个装饰器的执行顺序详解
2018/10/08 Python
python画图把时间作为横坐标的方法
2019/07/07 Python
关于Python内存分配时的小秘密分享
2019/09/05 Python
python groupby 函数 as_index详解
2019/12/16 Python
虚拟环境及venv和virtualenv的区别说明
2021/02/05 Python
阿迪达斯比利时官方商城:adidas比利时
2016/10/10 全球购物
Jeep牧马人、切诺基和自由人零配件:4 Wheel Drive Hardware
2017/07/02 全球购物
总经理助理岗位职责
2013/11/08 职场文书
自我评价范文分享
2014/01/04 职场文书
差生评语大全
2014/05/04 职场文书
室内趣味活动方案
2014/08/24 职场文书
导游词范文之颐和园/重庆/云台山
2019/09/10 职场文书
centos8安装nginx1.9.1的详细过程
2021/08/02 Servers
javascript条件式访问属性和箭头函数介绍
2021/11/17 Javascript
Elasticsearch 聚合查询和排序
2022/04/19 Python