Python统计学一数据的概括性度量详解


Posted in Python onMarch 03, 2020

一、数据的概括性度量

1、统计学概括:

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。

2、数据的概括性度量:

1)集中趋势的度量:

众数:众数(Mode),是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用M表示。

中位数:中位数(Median)是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。计算公式:

Python统计学一数据的概括性度量详解

四分位数:四分位数(Quartile)把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。QL=下四分位数,即第25百分位数( n / 4);QU=上四分位数,即第75百分位数( 3n / 4)。

平均数:算术平均数(arithmetic mean)算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。

2)离散趋势的度量:

四分位差:四分位差(quartile deviation),也称为内距或四分间距(inter-quartile range),它是上四分位数(QU,即位于75%)与下四分位数(QL,即位于25%)的差。

极差:全距(Range),又称极差,是用来表示统计资料中的变异量数(measures of variation),其最大值与最小值之间的差距

方差:方差(variance)(样本方差)是各个数据分别与其平均数之差的平方的和的平均数,通常以σ2表示,方差的计算公式为:

Python统计学一数据的概括性度量详解

标准差:标准差 (Standard Deviation),也称均方差(Mean square error), Python统计学一数据的概括性度量详解

离散系数:离散系数又称变异系数,CV(Coefficient of Variance)表示。CV(Coefficient of Variance):标准差与均值的比值。离散系数越小,数据的离散程度就越小,反之,亦然。

3)偏度与峰度的度量:

偏态系数:偏度(Skewness)亦称偏态、偏态系数,偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。Sk>0时,分布呈正偏态(右偏),Sk<0时,分布呈负偏态(左偏)。

峰态系数:(Kurtosis)峰度系数是用来反映频数分布曲线顶端尖峭或扁平程度的指标。在正态分布情况下,峰度系数值是3。>3的峰度系数说明观察量更集中,有比正态分布更短的尾部;<3的峰度系数说明观测量不那么集中,有比正态分布更长的尾部,类似于矩形的均匀分布。峰度系数的标准误用来判断分布的正态性。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。

3、Python代码实现:

<span style="font-family:Microsoft YaHei;font-size:12px;">#以下代码基于Python3.5环境编写
import numpy as np
import stats as sts
scores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23,
     32, 34, 43, 41, 21, 23, 26, 26, 34, 42,
     43, 25, 24, 23, 24, 44, 23, 14, 52,32,
     42, 44, 35, 28, 17, 21, 32, 42, 12, 34]
#集中趋势的度量
print('求和:',np.sum(scores))
print('个数:',len(scores))
print('平均值:',np.mean(scores))
print('中位数:',np.median(scores))
print('众数:',sts.mode(scores))
print('上四分位数',sts.quantile(scores,p=0.25))
print('下四分位数',sts.quantile(scores,p=0.75))
#离散趋势的度量
print('最大值:',np.max(scores))
print('最小值:',np.min(scores))
print('极差:',np.max(scores)-np.min(scores))
print('四分位差',sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))
print('标准差:',np.std(scores))
print('方差:',np.var(scores))
print('离散系数:',np.std(scores)/np.mean(scores))
#偏度与峰度的度量
print('偏度:',sts.skewness(scores))
print('峰度:',sts.kurtosis(scores))</span>

以上这篇Python统计学一数据的概括性度量详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python访问mysql数据库的实现方法(2则示例)
Jan 06 Python
Python 网页解析HTMLParse的实例详解
Aug 10 Python
Python向MySQL批量插数据的实例讲解
Mar 31 Python
python单例模式实例解析
Aug 28 Python
Python3.5迭代器与生成器用法实例分析
Apr 30 Python
详解python深浅拷贝区别
Jun 24 Python
Python 装饰器原理、定义与用法详解
Dec 07 Python
pytorch实现onehot编码转为普通label标签
Jan 02 Python
python实现替换word中的关键文字(使用通配符)
Feb 13 Python
OpenCV+Python3.5 简易手势识别的实现
Dec 21 Python
解决Pyinstaller打包软件失败的一个坑
Mar 04 Python
Python实现仓库管理系统
May 30 Python
python多维数组分位数的求取方式
Mar 03 #Python
浅谈pandas.cut与pandas.qcut的使用方法及区别
Mar 03 #Python
python Plotly绘图工具的简单使用
Mar 03 #Python
python 函数嵌套及多函数共同运行知识点讲解
Mar 03 #Python
python实现扫雷游戏
Mar 03 #Python
python实现从ftp服务器下载文件
Mar 03 #Python
python实现简单的购物程序代码实例
Mar 03 #Python
You might like
php4与php5的区别小结(配置异同)
2011/12/20 PHP
php数组比较实现查找连续数的方法
2015/07/29 PHP
php实现图片缩略图的方法
2016/03/29 PHP
PHP文件上传操作实例详解
2016/09/27 PHP
浅谈PHP的exec()函数无返回值排查方法(必看)
2017/03/31 PHP
PHP如何使用cURL实现Get和Post请求
2020/07/11 PHP
从父页面读取和操作iframe中内容方法
2009/07/25 Javascript
js操作时间(年-月-日 时-分-秒 星期几)
2010/06/20 Javascript
jQuery.validate 常用方法及需要注意的问题
2013/03/20 Javascript
node.js中的url.format方法使用说明
2014/12/10 Javascript
原生javascript实现DIV拖拽并计算重复面积
2015/01/02 Javascript
浅谈javascript实现八大排序
2015/04/27 Javascript
JavaScript入门系列之知识点总结
2016/03/24 Javascript
用JavaScript获取页面文档内容的实现代码
2016/06/10 Javascript
聊一聊jQuery插件uploadify使用方法
2016/08/24 Javascript
Vue 2.0 服务端渲染入门介绍
2017/03/29 Javascript
vue2导航根据路由传值,而改变导航内容的实例
2017/11/10 Javascript
JavaScript实现多态和继承的封装操作示例
2018/08/20 Javascript
详解关于React-Router4.0跳转不置顶解决方案
2019/05/10 Javascript
element-ui上传一张图片后隐藏上传按钮功能
2019/05/22 Javascript
详解JWT token心得与使用实例
2019/08/02 Javascript
JavaScript JSON数据处理全集(小结)
2019/08/15 Javascript
解决Pycharm无法import自己安装的第三方module问题
2018/05/18 Python
python3通过udp实现组播数据的发送和接收操作
2020/05/05 Python
Python使用Excel将数据写入多个sheet
2020/05/16 Python
python 日志模块 日志等级设置失效的解决方案
2020/05/26 Python
python tkinter的消息框模块(messagebox,simpledialog)
2020/11/07 Python
python爬虫调度器用法及实例代码
2020/11/30 Python
澳大利亚潮流尖端的快时尚品牌:Cotton On
2016/09/26 全球购物
预订从美国飞往印度的机票:MyTicketsToIndia
2017/05/19 全球购物
家长对学生的评语
2014/04/18 职场文书
关于青春的演讲稿500字
2014/08/22 职场文书
党员干部批评与自我批评反四风思想汇报
2014/09/21 职场文书
个人学习群众路线心得体会
2014/11/05 职场文书
2016年万圣节活动个人总结
2016/04/05 职场文书
深度学习详解之初试机器学习
2021/04/14 Python