Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python迭代用法实例教程
Sep 08 Python
详解Python中映射类型的内建函数和工厂函数
Aug 19 Python
Django视图之ORM数据库查询操作API的实例
Oct 27 Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 Python
Python 字符串与数字输出方法
Jul 16 Python
python查看列的唯一值方法
Jul 17 Python
Windows10+anacond+GPU+pytorch安装详细过程
Mar 24 Python
Python run()函数和start()函数的比较和差别介绍
May 03 Python
在python里使用await关键字来等另外一个协程的实例
May 04 Python
Pytorch框架实现mnist手写库识别(与tensorflow对比)
Jul 20 Python
python实现简单的tcp 文件下载
Sep 16 Python
Django跨域请求原理及实现代码
Nov 14 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
PHP中PDO的错误处理
2011/09/04 PHP
PHP检测移动设备类mobile detection使用实例
2014/04/14 PHP
php浏览历史记录的方法
2015/03/10 PHP
腾讯CMEM的PHP扩展编译安装方法
2015/09/25 PHP
php实现的debug log日志操作类实例
2016/07/12 PHP
Yii模型操作之criteria查找数据库的方法
2016/07/15 PHP
PHP回调函数概念与用法实例分析
2017/11/03 PHP
Laravel框架实现利用中间件进行操作日志记录功能
2018/06/06 PHP
laravel 去掉index.php伪静态的操作方法
2019/10/12 PHP
csdn 批量接受好友邀请
2009/02/19 Javascript
JavaScript Scoping and Hoisting 翻译
2012/07/03 Javascript
JQUERY dialog的用法详细解析
2013/12/19 Javascript
js实现iframe框架取值的方法(兼容IE,firefox,chrome等)
2015/11/26 Javascript
JS复制对应id的内容到粘贴板(Ctrl+C效果)
2017/01/23 Javascript
Canvas实现动态的雪花效果
2017/02/13 Javascript
Node.js使用gm拼装sprite图片
2017/07/04 Javascript
浅谈Angular2 模块懒加载的方法
2017/10/04 Javascript
vue中配置mint-ui报css错误问题的解决方法
2017/10/11 Javascript
基于VUE移动音乐WEBAPP跨域请求失败的解决方法
2018/01/16 Javascript
图文详解vue框架安装步骤
2019/02/12 Javascript
js编写简易的计算器
2020/07/29 Javascript
Python实现获取命令行输出结果的方法
2017/06/10 Python
python实现flappy bird游戏
2018/12/24 Python
在python 不同时区之间的差值与转换方法
2019/01/14 Python
对python3 Serial 串口助手的接收读取数据方法详解
2019/06/12 Python
学python安装的软件总结
2019/10/12 Python
python图形用户接口实例详解
2019/12/16 Python
scrapy-redis分布式爬虫的搭建过程(理论篇)
2020/09/29 Python
美国著名手表网站:Timepiece
2017/11/15 全球购物
Otiumberg官网:英国半精致珠宝品牌
2021/01/16 全球购物
《二泉映月》教学反思
2014/04/15 职场文书
嘉宾邀请函
2015/01/31 职场文书
村官个人总结范文
2015/03/03 职场文书
家长会主持词开场白
2015/05/29 职场文书
vue使用refs获取嵌套组件中的值过程
2022/03/31 Vue.js
Qt数据库应用之实现图片转pdf
2022/06/01 Java/Android