编程 Python

Python中的相关分析correlation analysis的实现

Posted in Python onAugust 29, 2019

相关分析（correlation analysis）

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊（Pearson）相关系数r来度量连续变量之间线性相关强度；
r>0,线性正相关；r<0,线性负相关；
r=0,两个变量之间不存在线性关系，并不代表两个变量之间不存在任何关系。

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明：
如果由数据框调用corr函数，那么将会计算每个列两两之间的相似度
如果由序列调用corr方法，那么只是该序列与传入的序列之间的相关度

返回值：
DataFrame调用；返回DataFrame

Series调用：返回一个数值型，大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python中的相关分析correlation analysis的实现

- Author -

Erin_data

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python的一些用法分享

Oct 07 Python

python网络编程实例简析

Sep 26 Python

Python输入二维数组方法

Apr 13 Python

解决Python 命令行执行脚本时,提示导入的包找不到的问题

Jan 19 Python

使用python 写一个静态服务(实战)

Jun 28 Python

Django中信号signals的简单使用方法

Jul 04 Python

pip 安装库比较慢的解决方法(国内镜像)

Oct 06 Python

Django+Celery实现动态配置定时任务的方法示例

May 26 Python

浅谈tensorflow 中的图片读取和裁剪方式

Jun 30 Python

python实现简易自习室座位预约系统

Jun 30 Python

Python中非常使用的6种基本变量的操作与技巧

Mar 22 Python

Python爬取奶茶店数据分析哪家最好喝以及性价比

Sep 23 Python

python中单下划线(_)和双下划线（__）的特殊用法

Aug 29 #Python

python 计算两个列表的相关系数的实现

Aug 29 #Python

python同步windows和linux文件

Aug 29 #Python

python中几种自动微分库解析

Aug 29 #Python

详解python中index()、find()方法

Aug 29 #Python

python同步两个文件夹下的内容

Aug 29 #Python

Python中 CSV格式清洗与转换的实例代码

Aug 29 #Python

You might like

PHP表单提交表单名称含有点号（.）则会被转化为下划线（_）

2011/12/14 PHP

php实现webservice实例

2014/11/06 PHP

PHP间隔一段时间执行代码的方法

2014/12/02 PHP

PHP 设计模式系列之 specification规格模式

2016/01/10 PHP

PHP数据库操作Helper类完整实例

2016/05/11 PHP

CI框架无限级分类+递归的实现代码

2016/11/01 PHP

JS 拼图游戏面向对象，注释完整。

2009/06/18 Javascript

一段批量给页面上的控件赋值js

2010/06/19 Javascript

基于jquery的实现简单的表格中增加或删除下一行

2010/08/01 Javascript

js中通过split函数分割字符串成数组小例子

2013/09/21 Javascript

jquery遍历checkbox介绍

2014/02/21 Javascript

JavaScript调用客户端Java程序的方法

2015/07/27 Javascript

jQuery中bind(),live(),delegate(),on()绑定事件方法实例详解

2016/01/19 Javascript

基于AngularJS+HTML+Groovy实现登录功能

2016/02/17 Javascript

JavaScript中数组去除重复的三种方法

2016/04/22 Javascript

jQuery实现模糊搜索功能的方法分析

2018/06/29 jQuery

Vue 实现显示/隐藏层的思路（加全局点击事件）

2019/12/31 Javascript

javascript设计模式 ? 职责链模式原理与用法实例分析

2020/04/16 Javascript

[01:05:07]DOTA2-DPC中国联赛正赛 DLG vs Dragon BO3 第一场2月1日

2021/03/11 DOTA

python生成随机密码或随机字符串的方法

2015/07/03 Python

python logging重复记录日志问题的解决方法

2018/07/12 Python

python re库的正则表达式入门学习教程

2019/03/08 Python

python实现kmp算法的实例代码

2019/04/03 Python

Python partial函数原理及用法解析

2019/12/11 Python

详解tf.device()指定tensorflow运行的GPU或CPU设备实现

2021/02/20 Python

CSS3 :default伪类选择器使用简介

2018/03/15 HTML / CSS

工程造价管理专业大专生求职信

2013/10/06 职场文书

体育教师自荐信范文

2013/12/16 职场文书

烹调加工管理制度

2014/02/04 职场文书

高校群众路线教育实践活动剖析材料

2014/10/10 职场文书

2014年安全员工作总结

2014/11/13 职场文书

借钱欠条怎么写

2015/07/03 职场文书

《语言的突破》读后感3篇

2019/12/12 职场文书

nginx内存池源码解析

2021/11/20 Servers

MySQL 执行数据库更新update操作的时候数据库卡死了

2022/05/02 MySQL

ssh服务器拒绝了密码请再试一次已解决(亲测有效)

2022/08/14 Servers