Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Java多线程编程中ThreadLocal类的用法及深入
Jun 21 Python
使用python编写简单的小程序编译成exe跑在win10上
Jan 15 Python
python+matplotlib实现礼盒柱状图实例代码
Jan 16 Python
pandas 按照特定顺序输出的实现代码
Jul 10 Python
完美解决python中ndarray 默认用科学计数法显示的问题
Jul 14 Python
Python中正则表达式的用法总结
Feb 22 Python
python3.6 如何将list存入txt后再读出list的方法
Jul 02 Python
Python小程序之在图片上加入数字的代码
Nov 26 Python
使用Python防止SQL注入攻击的实现示例
May 21 Python
python中strip(),lstrip(),rstrip()函数的使用讲解
Nov 17 Python
Python爬虫中urllib3与urllib的区别是什么
Jul 21 Python
Python Numpy库的超详细教程
Apr 06 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
网站用php实现paypal整合方法
2010/11/28 PHP
php mssql扩展SQL查询中文字段名解决方法
2012/10/15 PHP
php中单个数据库字段多列显示(单字段分页、横向输出)
2014/07/28 PHP
PHP使用DirectoryIterator显示下拉文件列表的方法
2015/03/13 PHP
PHP的Socket网络编程入门指引
2015/08/11 PHP
浅谈php中的访问修饰符private、protected、public的作用范围
2016/11/20 PHP
使用PHP开发留言板功能
2019/11/19 PHP
日期函数扩展类Ver0.1.1
2006/09/07 Javascript
通用于ie和firefox的函数 GetCurrentStyle (obj, prop)
2006/12/27 Javascript
jQuery jcrop插件截图使用方法
2013/11/20 Javascript
js防止页面被iframe调用的方法
2014/10/30 Javascript
基于jQuery的JavaScript模版引擎JsRender使用指南
2014/12/29 Javascript
Jquery实现鼠标移动放大图片功能实例
2015/03/25 Javascript
原生JavaScript实现动态省市县三级联动下拉框菜单实例代码
2016/02/03 Javascript
详解微信小程序的 request 封装示例
2018/08/21 Javascript
TypeScript中使用getElementXXX()的示例代码
2019/09/12 Javascript
微信小程序个人中心的列表控件实现代码
2020/04/26 Javascript
vc6编写python扩展的方法分享
2014/01/17 Python
在Python中使用元类的教程
2015/04/28 Python
python解析xml文件实例分析
2015/05/27 Python
Python 统计字数的思路详解
2018/05/08 Python
windows下pycharm安装、创建文件、配置默认模板
2018/07/31 Python
解决python测试opencv时imread导致的错误问题
2019/01/26 Python
ipython和python区别详解
2019/06/26 Python
Python中模块(Module)和包(Package)的区别详解
2019/08/07 Python
Python实现捕获异常发生的文件和具体行数
2020/04/25 Python
matplotlib绘制鼠标的十字光标的实现(内置方式)
2021/01/06 Python
Turnbull & Asser官网:英国皇室御用的顶级定制衬衫
2019/01/31 全球购物
日语专业推荐信
2013/11/12 职场文书
微观物理专业自荐信
2014/01/26 职场文书
节约电力资源的建议书
2014/03/12 职场文书
2014年廉洁自律承诺书
2014/05/26 职场文书
海洋科学专业求职信
2014/08/10 职场文书
2014年话务员工作总结
2014/11/19 职场文书
拾金不昧表扬稿大全
2015/05/05 职场文书
拥有这5个特征人,“命”都不会太差
2019/08/16 职场文书