Python中实现最小二乘法思路及实现代码


Posted in Python onJanuary 04, 2018

之所以说”使用”而不是”实现”,是因为python的相关类库已经帮我们实现了具体算法,而我们只要学会使用就可以了。随着对技术的逐渐掌握及积累,当类库中的算法已经无法满足自身需求的时候,我们也可以尝试通过自己的方式实现各种算法。

言归正传,什么是”最小二乘法”呢?

定义:最小二乘法(又称最小平方法)是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。

作用:利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

原则:以”残差平方和最小”确定直线位置(在数理统计中,残差是指实际观察值与估计值之间的差)

数学公式:

Python中实现最小二乘法思路及实现代码

基本思路:对于一元线性回归模型,假设从总体中获取了n组观察值(X1,Y1),(X2,Y2),…,(Xn,Yn),对于平面中的这n个点,可以使用无数条曲线来拟合。而线性回归就是要求样本回归函数尽可能好地拟合这组值,也就是说,这条直线应该尽可能的处于样本数据的中心位置。因此,选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。

实现代码如下,代码中已经详细的给了注释:

##最小二乘法
import numpy as np  ##科学计算库 
import scipy as sp  ##在numpy基础上实现的部分算法库
import matplotlib.pyplot as plt ##绘图库
from scipy.optimize import leastsq ##引入最小二乘法算法

'''
   设置样本数据,真实数据需要在这里处理
'''
##样本数据(Xi,Yi),需要转换成数组(列表)形式
Xi=np.array([6.19,2.51,7.29,7.01,5.7,2.66,3.98,2.5,9.1,4.2])
Yi=np.array([5.25,2.83,6.41,6.71,5.1,4.23,5.05,1.98,10.5,6.3])

'''
  设定拟合函数和偏差函数
  函数的形状确定过程:
  1.先画样本图像
  2.根据样本图像大致形状确定函数形式(直线、抛物线、正弦余弦等)
'''

##需要拟合的函数func :指定函数的形状
def func(p,x):
  k,b=p
  return k*x+b

##偏差函数:x,y都是列表:这里的x,y更上面的Xi,Yi中是一一对应的
def error(p,x,y):
  return func(p,x)-y

'''
  主要部分:附带部分说明
  1.leastsq函数的返回值tuple,第一个元素是求解结果,第二个是求解的代价值(个人理解)
  2.官网的原话(第二个值):Value of the cost function at the solution
  3.实例:Para=>(array([ 0.61349535, 1.79409255]), 3)
  4.返回值元组中第一个值的数量跟需要求解的参数的数量一致
'''

#k,b的初始值,可以任意设定,经过几次试验,发现p0的值会影响cost的值:Para[1]
p0=[1,20]

#把error函数中除了p0以外的参数打包到args中(使用要求)
Para=leastsq(error,p0,args=(Xi,Yi))

#读取结果
k,b=Para[0]
print("k=",k,"b=",b)
print("cost:"+str(Para[1]))
print("求解的拟合直线为:")
print("y="+str(round(k,2))+"x+"+str(round(b,2)))

'''
  绘图,看拟合效果.
  matplotlib默认不支持中文,label设置中文的话需要另行设置
  如果报错,改成英文就可以
'''

#画样本点
plt.figure(figsize=(8,6)) ##指定图像比例: 8:6
plt.scatter(Xi,Yi,color="green",label="样本数据",linewidth=2) 

#画拟合直线
x=np.linspace(0,12,100) ##在0-15直接画100个连续点
y=k*x+b ##函数式
plt.plot(x,y,color="red",label="拟合直线",linewidth=2) 
plt.legend(loc='lower right') #绘制图例
plt.show()

结果如下所示:

输出结果:

k= 0.900458420439 b= 0.831055638877
cost:1
求解的拟合直线为:
y=0.9x+0.83

绘图结果:

Python中实现最小二乘法思路及实现代码

补充说明:简单的列举了直线的情况,曲线的求解方式类似,但是曲线会存在过度拟合的情况,在以后的博客中会讲到。

总结

以上就是本文关于Python中实现最小二乘法思路及实现代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
用python读写excel的方法
Nov 18 Python
详解Python中的Cookie模块使用
Jul 06 Python
Python的Flask框架中的Jinja2模板引擎学习教程
Jun 30 Python
Python实现小数转化为百分数的格式化输出方法示例
Sep 20 Python
Sublime开发python程序的示例代码
Jan 24 Python
pandas的object对象转时间对象的方法
Apr 11 Python
Python3.5面向对象程序设计之类的继承和多态详解
Apr 24 Python
PyCharm 2019.3发布增加了新功能一览
Dec 08 Python
python-web根据元素属性进行定位的方法
Dec 13 Python
Python实现列表中非负数保留,负数转化为指定的数值方式
Jun 04 Python
Python爬取12306车次信息代码详解
Aug 12 Python
Python3.8.2安装包及安装教程图文详解(附安装包)
Nov 28 Python
Python找出最小的K个数实例代码
Jan 04 #Python
Python编程把二叉树打印成多行代码
Jan 04 #Python
2018年Python值得关注的开源库、工具和开发者(总结篇)
Jan 04 #Python
Win7下Python与Tensorflow-CPU版开发环境的安装与配置过程
Jan 04 #Python
教你用 Python 实现微信跳一跳(Mac+iOS版)
Jan 04 #Python
基于python实现在excel中读取与生成随机数写入excel中
Jan 04 #Python
python实现简易云音乐播放器
Jan 04 #Python
You might like
简单的页面缓冲技术
2006/10/09 PHP
WINDOWS下php5.2.4+mysql6.0+apache2.2.4+ZendOptimizer-3.3.0配置
2008/03/28 PHP
PHP IE中下载附件问题解决方法
2014/01/07 PHP
php遍历数组的4种方法总结
2014/07/05 PHP
Laravel 5框架学习之向视图传送数据(进阶篇)
2015/04/08 PHP
Yii 2中的load()和save()示例详解
2017/08/03 PHP
Yii实现微信公众号场景二维码的方法实例
2020/08/30 PHP
一个多次搜索+多次传值的解决方案
2007/01/20 Javascript
javascript支持firefox,ie7页面布局拖拽效果代码
2007/12/20 Javascript
javascript学习(二)javascript常见问题总结
2013/01/02 Javascript
jQuery中json对象的复制方式介绍(数组及对象)
2013/06/08 Javascript
jQuery实现仿美橙互联两级导航菜单的方法
2015/03/09 Javascript
javascript比较两个日期相差天数的方法
2015/07/24 Javascript
JS 清除字符串数组中,重复元素的实现方法
2016/05/24 Javascript
JavaScript 弹出子窗体并返回结果到父窗体的实现代码
2016/05/28 Javascript
JS实现探测网站链接的方法【测试可用】
2016/11/08 Javascript
vue-router跳转页面的方法
2017/02/09 Javascript
Three.js基础学习之场景对象
2017/09/27 Javascript
Vue header组件开发详解
2018/01/26 Javascript
vue.js实现只弹一次弹框
2018/01/29 Javascript
解决layui的table插件无法多层级获取json数据的问题
2019/09/19 Javascript
举例详解Python中threading模块的几个常用方法
2015/06/18 Python
Python微信公众号开发平台
2018/01/25 Python
对Python3中的print函数以及与python2的对比分析
2018/05/02 Python
Python不使用int()函数把字符串转换为数字的方法
2018/07/09 Python
django表单的Widgets使用详解
2019/07/22 Python
django 连接数据库出现1045错误的解决方式
2020/05/14 Python
解决Python数据可视化中文部分显示方块问题
2020/05/16 Python
python 中的9个实用技巧,助你提高开发效率
2020/08/30 Python
详解HTML5中div和section以及article的区别
2015/07/14 HTML / CSS
日本一家专门经营各种箱包的大型网站:Traveler Store
2016/08/03 全球购物
怎样有效的进行自我评价
2013/10/06 职场文书
幼儿园教师师德承诺书
2015/04/28 职场文书
幼儿园见习总结
2015/06/23 职场文书
公司行政管理制度范本
2015/08/05 职场文书
《富饶的西沙群岛》教学反思
2016/02/16 职场文书