Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中操作文件之write()方法的使用教程
May 25 Python
python微信公众号之关键词自动回复
Jun 15 Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 Python
elasticsearch python 查询的两种方法
Aug 04 Python
使用OpenCV实现仿射变换—缩放功能
Aug 29 Python
python接口自动化如何封装获取常量的类
Dec 24 Python
通过Turtle库在Python中绘制一个鼠年福鼠
Feb 03 Python
Python matplotlib画曲线例题解析
Feb 07 Python
Python中文分词库jieba,pkusegwg性能准确度比较
Feb 11 Python
解决python ThreadPoolExecutor 线程池中的异常捕获问题
Apr 08 Python
利用python生成照片墙的示例代码
Apr 09 Python
python 制作本地应用搜索工具
Feb 27 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
PHP 远程文件管理,可以给表格排序,遍历目录,时间排序
2009/08/07 PHP
PHP 日常开发小技巧
2009/09/23 PHP
php命令行使用方法和命令行参数说明
2014/04/08 PHP
Linux下手动编译安装PHP扩展的例子分享
2014/07/15 PHP
php实现文件上传及头像预览功能
2017/01/15 PHP
Laravel实现短信注册的示例代码
2018/05/29 PHP
使用PHP访问RabbitMQ消息队列的方法示例
2018/06/06 PHP
xtree.js 代码
2007/03/13 Javascript
js prototype截取字符串函数
2010/04/01 Javascript
JQuery实现的在新窗口打开链接的方法小结
2010/04/22 Javascript
基于Jquery的开发个代阴影的对话框效果代码
2011/07/28 Javascript
javascript获取选中的文本的方法代码
2013/10/30 Javascript
jquery修改网页背景颜色通过css方法实现
2014/06/06 Javascript
网站接入QQ登录的两种方法
2014/07/22 Javascript
基于jQuery实现搜索关键字自动匹配功能
2020/03/26 Javascript
关于webuploader插件使用过程遇到的小问题
2016/11/07 Javascript
JavaScript中 this 指向问题深度解析
2017/02/21 Javascript
vue快捷键与基础指令详解
2017/06/01 Javascript
JavaScript操作文件_动力节点Java学院整理
2017/06/30 Javascript
Angular @HostBinding()和@HostListener()用法
2018/03/05 Javascript
json 带斜杠时如何解析的实现
2019/08/12 Javascript
《javascript设计模式》学习笔记七:Javascript面向对象程序设计组合模式详解
2020/04/08 Javascript
node使用async_hooks模块进行请求追踪
2021/01/28 Javascript
约瑟夫问题的Python和C++求解方法
2015/08/20 Python
Python编码类型转换方法详解
2016/07/01 Python
Python字符串、列表、元组、字典、集合的补充实例详解
2019/12/20 Python
python之pygame模块实现飞机大战完整代码
2020/11/29 Python
python判断all函数输出结果是否为true的方法
2020/12/03 Python
澳大利亚著名的纺织品品牌:Canningvale
2020/05/05 全球购物
基层干部2014全国两会学习心得体会
2014/03/10 职场文书
分公司任命书
2014/06/06 职场文书
铣工实训报告
2014/11/05 职场文书
nginx限制并发连接请求数的方法
2021/04/01 Servers
JavaScript原始值与包装对象的详细介绍
2021/05/11 Javascript
python-opencv 中值滤波{cv2.medianBlur(src, ksize)}的用法
2021/06/05 Python
Linux中一对多配置日志服务器的详细步骤
2022/07/23 Servers