Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python如何读取MySQL数据库表数据
Mar 11 Python
python嵌套字典比较值与取值的实现示例
Nov 03 Python
Python实现生成随机日期字符串的方法示例
Dec 25 Python
浅谈python numpy中nonzero()的用法
Apr 02 Python
对numpy的array和python中自带的list之间相互转化详解
Apr 13 Python
Python3实现的简单验证码识别功能示例
May 02 Python
python覆盖写入,追加写入的实例
Jun 26 Python
elasticsearch python 查询的两种方法
Aug 04 Python
Python 图像对比度增强的几种方法(小结)
Sep 25 Python
Python xlrd模块导入过程及常用操作
Jun 10 Python
Keras框架中的epoch、bacth、batch size、iteration使用介绍
Jun 10 Python
python基于爬虫+django,打造个性化API接口
Jan 21 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
PHP发明人谈MVC和网站设计架构 貌似他不支持php用mvc
2011/06/04 PHP
php 转换字符串编码 iconv与mb_convert_encoding的区别说明
2011/11/10 PHP
php数组去重的函数代码
2013/02/03 PHP
php计划任务之ignore_user_abort函数实现方法
2015/01/08 PHP
thinkPHP框架实现多表查询的方法
2018/06/14 PHP
jquery限制输入字数,并提示剩余字数实现代码
2012/12/24 Javascript
jquery简单的拖动效果实现原理及示例
2013/07/26 Javascript
jquery根据name属性查找的小例子
2013/11/21 Javascript
js 3秒后跳转页面的实现代码
2014/03/10 Javascript
BAT及各大互联网公司2014前端笔试面试题--JavaScript篇
2014/10/29 Javascript
javascript如何创建对象
2016/08/29 Javascript
js正则表达式惰性匹配和贪婪匹配用法分析
2016/12/26 Javascript
vue-baidu-map 进入页面自动定位的解决方案(推荐)
2018/04/28 Javascript
小程序实现页面顶部选项卡效果
2018/11/06 Javascript
Vue开发Html5微信公众号的步骤
2019/04/11 Javascript
layui给下拉框、按钮状态、时间赋初始值的方法
2019/09/10 Javascript
微信小程序使用echarts获取数据并生成折线图
2019/10/16 Javascript
JS插入排序简单理解与实现方法分析
2019/11/25 Javascript
vue+element实现图片上传及裁剪功能
2020/06/29 Javascript
[02:03]《现实生活中的DOTA2》—林书豪&DOTA2职业选手出演短片
2015/08/18 DOTA
python通过ssh-powershell监控windows的方法
2015/06/02 Python
Python for Informatics 第11章 正则表达式(一)
2016/04/21 Python
spyder常用快捷键(分享)
2017/07/19 Python
Python简单获取网卡名称及其IP地址的方法【基于psutil模块】
2018/05/24 Python
关于PyCharm安装后修改路径名称使其可重新打开的问题
2020/10/20 Python
opencv+pyQt5实现图片阈值编辑器/寻色块阈值利器
2020/11/13 Python
逼真的HTML5树叶飘落动画
2016/03/01 HTML / CSS
美国Rue La La闪购网站:奢侈品、中高档品牌限时折扣
2016/10/19 全球购物
欧洲著名的珠宝和手表网上商城:uhrcenter
2017/04/10 全球购物
匡威荷兰官方网站:Converse荷兰
2018/10/24 全球购物
沃尔玛旗下墨西哥超市:Bodega Aurrera
2020/11/13 全球购物
动漫设计与制作专业推荐信
2014/07/07 职场文书
大学军训决心书
2015/02/05 职场文书
语文教师个人工作总结
2015/02/06 职场文书
CAD实训总结范文
2015/08/03 职场文书
幼儿园中班教育随笔
2015/08/14 职场文书