深入浅析Python科学计算库Scipy及安装步骤


Posted in Python onOctober 12, 2019

一、Scipy 入门

1.1、Scipy 简介及安装

官网:http://www.scipy.org/SciPy

安装:在C:\Python27\Scripts下打开cmd执行:

执行:pip install scipy

1.2、安装Anaconda及环境搭建(举例演示)

创建环境:conda create -n env_name python=3.6

示例:   conda create -n Py_36 python=3.6  #创建名为Py_367的环境

列出所有环境:conda info -e

进入环境:   source activate Py_36  (OSX/LINUX系统)

            activate Py_36          (windows系统)

1.3、jupyter 安装

jupyter简介:jupyter(Jupyter Notebook)是一个交互式笔记本

            支持运行40多种编程语言

            数据清理和转换,数值模拟,统计建模,机器学习等

jupyter 安装:conda install jupyter notebook

启动 jupyter:激活相应环境

在控制台执行 :jupyter notebook

notebook服务器运行地址:http://localhost:8888   

                新建(notebook,文本文件,文件夹)

关闭notebook:ctrl+c执行两次

jupyter notebook 使用:

    快捷键:shift+Enter     运行本单元,选中下个单元

           Ctrl+Enter      运行本单元,在其下方插入新单元
            Y              单元进入代码状态
            M              单元进入markdown状态
            A              在上方插入新单元
            B              在下方插入新单元
            X              剪切选中单元
            Shift+V        在上方粘贴单元      

1.4、scipy的'hello word'

需求:将一个多维数组保存a.mat文件,后加载该mat文件,获取内容并打印

步骤1:导入scipy需要的模块

    from scipy import io    #(需要使用的模块)

步骤2:利用savemat保存数据

io.savemat(file_name,mdict)
  io.savemat('a.mat',{''array:a})

步骤3:利用 loadmat载入数据

io.loadmat(file_name)
  data = io.loadmat('a.mat')

举例1:

from scipy import io    #导入io
import numpy as np    #导入numpy并命名为np 
arr = np.array([1,2,3,4,5,6])
io.savemat('test.mat',{'arr1':arr})
loadArr=io.loadmat('test.mat')

举例2

from matplotlib import pyplot as plt
from scipy import io
import numpy as np
matrix1 = np.arange(1,10).reshape(3,3)   #创建矩阵
io.savemat("matrix1.mat", {"array": matrix1}) #保存矩阵文件
data=io.loadmat('matrix1.mat')     #读取矩阵文件
print (data["array"])       #输出矩阵

p1 = np.random.normal(size = 10000) #新建随机数
plt.hist(p1)       #绘制柱形图
plt.show()       #显示

二、利用Scipy实现统计功能

需求:用Scipy的scipy.stats中的统计函数分析随机数
stats提供了产生连续性分布的函数
均匀分布(uniform)
                x=stats.uniform.rvs(size = 20) 生成20个[0,1]均匀分布随机数
-正态分布(norm)
                x=stats.norm.rvs(size = 20) 生成20个正态分布随机数
-贝塔分布(beta)
                x=stats.beta.rvs(size=20,a=3,b=4)生成20个服从参数a=3,b=4贝塔分布随机数
-离散分布
-伯努利分布(Bernoulli)
-几何分布(geom)
-泊松分布(poisson)
x=stats.poisson.rvs(0.6,loc=0,size = 20)生成20个服从泊松分布随机数

三、计算随机数均值和标准差

stats.norm.fit :利用正态分布去拟合生成的数据,得到其均值和标准差

四、计算随机数的偏度

1.概念:
                偏度(skewness)描述的是概率分布的偏度(非对称)程度。
                有两个返回值,第二个为p-value,即数据集服从正态分布的概率(0~1)

2 利用 stats.skewtest()计算偏度

五、计算随机数的峰度

1 概念:峰度(kurtosis)-描述的是概率分布曲线陡峭程度
2 利用 stats.kurtosis() 计算峰度
3 正态分布峰度值为3,excess_k为0
              低阔峰(platykurtic) 相对于正态分布来说更扁平 excess_k<0
              高狭峰(leptokurtic) 相对于正态分布来说更陡峭 excess_k>0

示例:(../Scipy/Test01/test1)

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

arr = stats.norm.rvs(size=900)
(mean,std) = stats.norm.fit(arr)
print('平均值',mean)  #mean平均值
print('std标准差',std)  #std标准差
(skewness,pvalue1) = stats.skewtest(arr)
print('偏度值') 
print(skewness)
print('符合正态分布数据的概率为')
print(pvalue1)
(Kurtosistest,pvalue2) = stats.kurtosistest(arr)
print('Kurtosistest',Kurtosistest) #峰度
print('pvalue2',pvalue2)
(Normltest,pvalue3) = stats.normaltest(arr)
print('Normltest',Normltest)   #服从正太分布度
print('pvalue3',pvalue3)
num = stats.scoreatpercentile(arr,95) #某一百分比处的数值
print('在95%处的数值:')    #某一百分比处的数值
print num
indexPercent = stats.percentileofscore(arr,1) #某一数值处的百分比
print ('在数值1处的百分比:')     #某一数值处的百分比
print indexPercent
plt.hist(arr) #设置直方图
plt.show()  #显示图

六、正态分布程度检验

1 正态性检验(normality test),同样返回两个值,第二个返回p-values
2 利用 检验      stats.normaltest()
        一般情况     pvalue>0.05                表示服从正态分布

七、计算数据所在区域中某一百分比处的数值

1 利用scoreatpercentile 计算在某一百分比位置的数值
                格式:scoreatpercentile (数据集、百分比)
                                   stats.scoreatpercentile(name_arr,percent)
2 示例:求出95%所在位置的数值

              

num = stats.scoreatpercentile(arr,95) 
    print num

八、从某数值出发找到对应的百分比

利用percentileofscore计算在某数值对应的百分比
                格式:percentileofscore(数据集,数值)
                示例:indexPercent = stats.percentileofscore(arr,1)

九、直方图显示

import matplotlib.pyplot as plt

在Anaconda环境下(py36)C:\Users\lenovo>导入:conda install matplotlib
                plt.hist(arr) #设置直方图
                plt.show() #显示图

九、综合练习

1 求出考试分数的以下值:

均值          中位数       众数        极差          方差 
标准差        变异系数(均值/方差)       偏度          峰度

2 步骤1: 创建两个二维数组:[分数,出现次数]

arrEasy=np.array([[0,2],[2.5,4],[5,6],[7.5,9],[10,13],[12.5,16],[15,19],[17.5,23],
    [20,27],[22.5,31],[25,35],[27.5,40],[30,53],[32.5,68],[35,90],
    [37.5,110],[40,130],[42.5,148],[45,165],[47.5,182],[50,195],
    [52.5,208],[55,217],[57.5,226],[60,334],[62.5,342],[65,349],
    [67.5,500],[70,511],[72.5,300],[75,200],[77.5,80],[80,20]])
arrDiff=np.array([[0,20],[2.5,30],[5,45],[7.5,70],[10,100],[12.5,135],[15,170],
    [17.5,205],[20,226],[22.5,241],[25,251],[27.5,255],[30,256],
    [32.5,253],[35,249],[37.5,242],[40,234],[42.5,226],[45,217],
    [47.5,208],[50,195],[52.5,182],[55,165],[57.5,148],[60,130],
    [62.5,110],[65,40],[67.5,30],[70,20],[72.5,5],[75,5],[77.5,0],[80,0]])

步骤2:创建函数,将传入的多维数组扁平化->变成一维数组

方法1:

def createScore(arr):
 score = []   #所有学员分数
 row = arr.shape[0]
 for i in np.arange(0,row):
  for j in np.arange(0,int(arr[i][1])):
  score.append(arr[i][1]))
 score = np.array(score)
 return score

方法2

score_Easy, num_Easy = arrEasy[:,0],arrEasy[:,1] #所有行第一列;所有行第二列
score_Diff, num_Diff = arrDiff[:,0],arrDiff[:,1] #同上
print (score_Easy,num_Easy )
print (score_Diff,num_Diff )

步骤3:创建函数,根据传入数组,对其进行统计

def calStatValue(score):
 #集中趋势度量
 print('均值')
 print(np.mean(score))
 print('中位数')
 print(np.median(score))
 print('众数')
 print(stats.mode(score))
 #离散趋势度量
 print('极差')
 print(np.ptp(score))
 print('方差')
 print(np.var(score))
 print('标准差')
 print(np.std(score))
 print('变异系数')
 print(np.mean(score)/np.std(score))
 #偏度与峰度的度量
 print('偏度')
 print(stats.skewness(score))
 print('峰度')
 print(stats.Kurtosis(score))

步骤4:创建函数,做一个简单的箱线图/柱形图

def drawGraghic(score)
 plt.boxplot([score],labels['score']) #箱线图
 plt.title('箱线图')
 plt.show()
 plt.hist(score,100)
 plt.show()

步骤5:

步骤6:

案例完整代码:

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
def createScore(arr):
 score = []     #所有学员分数
 row = arr.shape[0]   #获取多少组元素
 for i in np.arange(0,row): #遍历所有元素组
  for j in np.arange(0,int(arr[i][1])):#从0开始填充次数,第i行第1列
   score.append(arr[i][0]))
 score = np.array(score)
 return score
_________________________________
使用切片获取分数
score_Easy, num_Easy = arrEasy[:,0],arrEasy[:,1] #所有行第一列;所有行第二列
score_Diff, num_Diff = arrDiff[:,0],arrDiff[:,1] #同上
print (score_Easy,num_Easy)   #查看分数,人数
print (score_Diff,num_Diff)   #同上
All_score_Easy = np.repeat(list(score_Easy),list(num_Easy)) #所有分数
All_score_Diff = np.repeat(list(score_Diff),list(num_Diff)) #所有分数
________________________________
def createOneScore():
 arrEasy=np.array([[0,2],[2.5,4],[5,6],[7.5,9],[10,13],[12.5,16],[15,19],[17.5,23],
    [20,27],[22.5,31],[25,35],[27.5,40],[30,53],[32.5,68],[35,90],
    [37.5,110],[40,130],[42.5,148],[45,165],[47.5,182],[50,195],
    [52.5,208],[55,217],[57.5,226],[60,334],[62.5,342],[65,349],
    [67.5,500],[70,511],[72.5,300],[75,200],[77.5,80],[80,20]])
 return createScore(arrOne)
def createTwoScore():  
 arrDiff=np.array([[0,20],[2.5,30],[5,45],[7.5,70],[10,100],[12.5,135],[15,170],
    [17.5,205],[20,226],[22.5,241],[25,251],[27.5,255],[30,256],
    [32.5,253],[35,249],[37.5,242],[40,234],[42.5,226],[45,217],
    [47.5,208],[50,195],[52.5,182],[55,165],[57.5,148],[60,130],
    [62.5,110],[65,40],[67.5,30],[70,20],[72.5,5],[75,5],[77.5,0],[80,0]])
 return createScore(arrTwo)
def calStatValue(score):
 #集中趋势度量
 print('均值')
 print(np.mean(score))
 print('中位数')
 print(np.median(score))
 print('众数')
 print(stats.mode(score))
 #离散趋势度量
 print('极差')
 print(np.ptp(score))
 print('方差')
 print(np.var(score))
 print('标准差')
 print(np.std(score))
 print('变异系数')
 print(np.mean(score)/np.std(score))
 #偏度与峰度的度量
 (skewness,pvalue1) = stats.skewtest(score) 
 print('偏度')
 print(stats.skewness(score))
 (Kurtosistest,pvalue2) = stats.kurtosistest(arr)
 print('峰度')
 print(stats.Kurtosis(score)) 
 return
#画图
def drawGraghic(score)
 plt.boxplot([score],labels['score']) #箱线图
 plt.title('箱线图')
 plt.show()
 plt.hist(score,100)
 plt.show()
 return

          总结

以上所述是小编给大家介绍的Python科学计算库—Scipy,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
win7安装python生成随机数代码分享
Dec 27 Python
Python列表append和+的区别浅析
Feb 02 Python
用Python编写一个基于终端的实现翻译的脚本
Apr 24 Python
Python3计算三角形的面积代码
Dec 18 Python
Python多线程原理与用法详解
Aug 20 Python
对pandas数据判断是否为NaN值的方法详解
Nov 06 Python
python神经网络编程实现手写数字识别
May 27 Python
PyInstaller的安装和使用的详细步骤
Jun 02 Python
Python能做什么
Jun 02 Python
用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)
Jun 04 Python
python如何支持并发方法详解
Jul 25 Python
Python3如何使用多线程升程序运行速度
Aug 11 Python
Django1.11配合uni-app发起微信支付的实现
Oct 12 #Python
Python数据处理篇之Sympy系列(五)---解方程
Oct 12 #Python
详解Python绘图Turtle库
Oct 12 #Python
Python中的list与tuple集合区别解析
Oct 12 #Python
Python 生成器,迭代,yield关键字,send()传参给yield语句操作示例
Oct 12 #Python
Python 类,property属性(简化属性的操作),@property,property()用法示例
Oct 12 #Python
python获取全国城市pm2.5、臭氧等空气质量过程解析
Oct 12 #Python
You might like
解析php中eclipse 用空格替换 tab键
2013/06/24 PHP
PHP时间戳 strtotime()使用方法和技巧
2013/10/29 PHP
PHP+Javascript实现在线拍照功能实例
2015/07/18 PHP
PHP封装的验证码工具类定义与用法示例
2018/08/22 PHP
thinkphp框架表单数组实现图片批量上传功能示例
2020/04/04 PHP
jQuery 1.0.2
2006/10/11 Javascript
线路分流自动智能跳转代码,自动选择最快镜像网站(js)
2011/10/31 Javascript
js 获取屏幕各种宽高的方法(浏览器兼容)
2013/05/15 Javascript
js整数字符串转换为金额类型数据(示例代码)
2013/12/26 Javascript
jquery删除ID为sNews的tr元素的内容
2014/04/10 Javascript
使用AngularJS中的SCE来防止XSS攻击的方法
2015/06/18 Javascript
基于javascript显示当前时间以及倒计时功能
2016/03/18 Javascript
javascript正则表达式之分组概念与用法实例
2016/06/16 Javascript
JavaScript程序中实现继承特性的方式总结
2016/06/24 Javascript
JS判断是否为JSON对象及是否存在某字段的方法(推荐)
2016/11/29 Javascript
Android中Okhttp3实现上传多张图片同时传递参数
2017/02/18 Javascript
js实现字符全排列算法的简单方法
2017/05/01 Javascript
如何开发出更好的JavaScript模块
2017/12/22 Javascript
详解create-react-app 自定义 eslint 配置
2018/06/07 Javascript
JS函数进阶之prototy用法实例分析
2020/01/15 Javascript
JS关闭子窗口并且刷新上一个窗口的实现示例
2020/03/10 Javascript
[00:12]2018DOTA2亚洲邀请赛SOLO赛 MidOne是否中单第一人?
2018/04/05 DOTA
python dataframe常见操作方法:实现取行、列、切片、统计特征值
2018/06/09 Python
Python爬虫之正则表达式基本用法实例分析
2018/08/08 Python
解决PySide+Python子线程更新UI线程的问题
2019/01/11 Python
Python这样操作能存储100多万行的xlsx文件
2019/04/16 Python
解决python replace函数替换无效问题
2020/01/18 Python
python 画条形图(柱状图)实例
2020/04/24 Python
使用Python合成图片的实现代码(图片添加个性化文本,图片上叠加其他图片)
2020/04/30 Python
Python如何在循环内使用list.remove()
2020/06/01 Python
基于opencv的selenium滑动验证码的实现
2020/07/24 Python
使用Python将xmind脑图转成excel用例的实现代码(一)
2020/10/12 Python
Nordgreen手表德国官方网站:丹麦极简主义手表
2019/10/31 全球购物
DeinDesign德国:设计自己的手机壳
2019/12/14 全球购物
竞选大队委员演讲稿
2014/04/28 职场文书
买房协议书范本
2014/10/23 职场文书