Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中字符编码简介、方法及使用建议
Jan 08 Python
Python实现获取某天是某个月中的第几周
Feb 11 Python
对于Python的Django框架使用的一些实用建议
Apr 03 Python
Tensorflow 利用tf.contrib.learn建立输入函数的方法
Feb 08 Python
python 实时得到cpu和内存的使用情况方法
Jun 11 Python
对python 生成拼接xml报文的示例详解
Dec 28 Python
Python实战之制作天气查询软件
May 14 Python
python识别图像并提取文字的实现方法
Jun 28 Python
Python read函数按字节(字符)读取文件的实现
Jul 03 Python
python numpy--数组的组合和分割实例
Feb 24 Python
使用Pyhton 分析酒店针孔摄像头
Mar 04 Python
Python使用Turtle模块绘制国旗的方法示例
Feb 28 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
php插入中文到sqlserver 2008里出现乱码的解决办法分享
2012/07/19 PHP
解析zend studio中直接导入svn中的项目的方法步骤
2013/06/21 PHP
php异步多线程swoole用法实例
2014/11/14 PHP
php array_slice 取出数组中的一段序列实例
2016/11/04 PHP
tp5(thinkPHP5框架)使用DB实现批量删除功能示例
2019/05/28 PHP
用prototype实现的简单小巧的多级联动菜单
2007/03/24 Javascript
JavaScript 在线压缩和格式化收藏
2009/01/16 Javascript
Web开发者必备的12款超赞jQuery插件
2010/12/03 Javascript
Fixie.js 自动填充内容的插件
2012/06/28 Javascript
点击弹出层效果&amp;弹出窗口后网页背景变暗效果的实现代码
2014/02/10 Javascript
使用命令对象代替switch语句的写法示例
2015/02/28 Javascript
Bootstrap每天必学之基础排版
2015/11/20 Javascript
探讨JavaScript标签位置的存放与功能有无关系
2016/01/15 Javascript
input框中的name和id的区别
2016/11/16 Javascript
JavaScript调试的多个必备小Tips
2017/01/15 Javascript
利用n工具轻松管理Node.js的版本
2017/04/21 Javascript
vue-axios使用详解
2017/05/10 Javascript
微信小程序获取手机号授权用户登录功能
2017/11/09 Javascript
基于游标的分页接口实现代码示例
2018/11/12 Javascript
详解webpack的clean-webpack-plugin插件报错
2020/10/16 Javascript
[03:37]2016完美“圣”典 风云人物:Mikasa专访
2016/12/07 DOTA
Python中使用Boolean操作符做真值测试实例
2015/01/30 Python
Nginx搭建HTTPS服务器和强制使用HTTPS访问的方法
2015/08/16 Python
python获取外网IP并发邮件的实现方法
2017/10/01 Python
Django中如何使用sass的方法步骤
2019/07/09 Python
Python实现网页截图(PyQT5)过程解析
2019/08/12 Python
Python类的动态绑定实现原理
2020/03/21 Python
新浪网技术部笔试题
2016/08/26 面试题
社区工作者思想汇报
2014/01/13 职场文书
幼儿园亲子活动方案
2014/01/29 职场文书
情侣吵架检讨书
2014/02/05 职场文书
《我要的是葫芦》教学反思
2014/02/23 职场文书
人力资源管理专业毕业生自荐书
2014/05/25 职场文书
PHP设计模式(观察者模式)
2021/07/07 PHP
java解析XML详解
2021/07/09 Java/Android
2021好看的国漫排行榜前十名 《完美世界》上榜,《元龙》排名第一
2022/03/18 国漫