python机器学习理论与实战(五)支持向量机


Posted in Python onJanuary 19, 2018

       做机器学习的一定对支持向量机(support vector machine-SVM)颇为熟悉,因为在深度学习出现之前,SVM一直霸占着机器学习老大哥的位子。他的理论很优美,各种变种改进版本也很多,比如latent-SVM, structural-SVM等。这节先来看看SVM的理论吧,在(图一)中A图表示有两类的数据集,图B,C,D都提供了一个线性分类器来对数据进行分类?但是哪个效果好一些?

python机器学习理论与实战(五)支持向量机

(图一)

        可能对这个数据集来说,三个的分类器都一样足够好了吧,但是其实不然,这个只是训练集,现实测试的样本分布可能会比较散一些,各种可能都有,为了应对这种情况,我们要做的就是尽可能的使得线性分类器离两个数据集都尽可能的远,因为这样就会减少现实测试样本越过分类器的风险,提高检测精度。这种使得数据集到分类器之间的间距(margin)最大化的思想就是支持向量机的核心思想,而离分类器距离最近的样本成为支持向量。既然知道了我们的目标就是为了寻找最大边距,怎么寻找支持向量?如何实现?下面以(图二)来说明如何完成这些工作。

python机器学习理论与实战(五)支持向量机

(图二)

假设(图二)中的直线表示一个超面,为了方面观看显示成一维直线,特征都是超面维度加一维度的,图中也可以看出,特征是二维,而分类器是一维的。如果特征是三维的,分类器就是一个平面。假设超面的解析式为python机器学习理论与实战(五)支持向量机,那么点A到超面的距离为python机器学习理论与实战(五)支持向量机,下面给出这个距离证明:

python机器学习理论与实战(五)支持向量机

(图三)

在(图三)中,青色菱形表示超面,Xn为数据集中一点,W是超面权重,而且W是垂直于超面的。证明垂直很简单,假设X'和X''都是超面上的一点,

python机器学习理论与实战(五)支持向量机

因此W垂直于超面。知道了W垂直于超面,那么Xn到超面的距离其实就是Xn和超面上任意一点x的连线在W上的投影,如(图四)所示:

python机器学习理论与实战(五)支持向量机

套进拉格朗日乘子法公式得到如(公式五)所示的样子:

python机器学习理论与实战(五)支持向量机

(公式五)

        在(公式五)中通过拉格朗日乘子法函数分别对W和b求导,为了得到极值点,令导数为0,得到

python机器学习理论与实战(五)支持向量机

 ,然后把他们代入拉格朗日乘子法公式里得到(公式六)的形式:

python机器学习理论与实战(五)支持向量机

(公式六)

     (公式六)后两行是目前我们要求解的优化函数,现在只需要做个二次规划即可求出alpha,二次规划优化求解如(公式七)所示:

python机器学习理论与实战(五)支持向量机

(公式七)

         通过(公式七)求出alpha后,就可以用(公式六)中的第一行求出W。到此为止,SVM的公式推导基本完成了,可以看出数学理论很严密,很优美,尽管有些同行们认为看起枯燥,但是最好沉下心来从头看完,也不难,难的是优化。二次规划求解计算量很大,在实际应用中常用SMO(Sequential minimal optimization)算法,SMO算法打算放在下节结合代码来说。

参考文献:

     [1]machine learning in action. Peter Harrington

     [2] Learning From Data. Yaser S.Abu-Mostafa

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python脚本将文字转换为图片的实例分享
Aug 29 Python
python3实现TCP协议的简单服务器和客户端案例(分享)
Jun 14 Python
浅谈Django学习migrate和makemigrations的差别
Jan 18 Python
数组保存为txt, npy, csv 文件, 数组遍历enumerate的方法
Jul 09 Python
基于Python实现迪杰斯特拉和弗洛伊德算法
May 27 Python
对python pandas读取剪贴板内容的方法详解
Jan 24 Python
浅谈pyqt5中信号与槽的认识
Feb 17 Python
Python 共享变量加锁、释放详解
Aug 28 Python
Python注释、分支结构、循环结构、伪“选择结构”用法实例分析
Jan 09 Python
利用Python实现Json序列化库的方法步骤
Sep 09 Python
python 列表推导和生成器表达式的使用
Feb 01 Python
python APScheduler执行定时任务介绍
Apr 19 Python
Python读取图片为16进制表示简单代码
Jan 19 #Python
Python实现pdf文档转txt的方法示例
Jan 19 #Python
浅谈Python实现2种文件复制的方法
Jan 19 #Python
用Python进行简单图像识别(验证码)
Jan 19 #Python
flask中使用蓝图将路由分开写在不同文件实例解析
Jan 19 #Python
python模拟事件触发机制详解
Jan 19 #Python
flask使用session保存登录状态及拦截未登录请求代码
Jan 19 #Python
You might like
Apache2 httpd.conf 中文版
2006/11/17 PHP
PHP 变量的定义方法
2010/01/26 PHP
php中json_encode处理gbk与gb2312中文乱码问题的解决方法
2014/07/10 PHP
yii实现使用CUploadedFile上传文件的方法
2015/12/28 PHP
Laravel SQL语句记录方式(推荐)
2016/05/26 PHP
Laravel 5.3 学习笔记之 错误&日志
2016/08/28 PHP
PHP递归实现文件夹的复制、删除、查看大小操作示例
2017/08/11 PHP
启用OPCache提高PHP程序性能的方法
2019/03/21 PHP
JS画线(实例代码)
2013/11/20 Javascript
利用JS进行图片的切换即特效展示图片
2013/12/03 Javascript
Javascript访问器属性实例分析
2014/12/30 Javascript
jQuery插件Zclip实现完美兼容个浏览器点击复制内容到剪贴板
2015/04/30 Javascript
JavaScript简单遍历DOM对象所有属性的实现方法
2015/10/21 Javascript
开启Javascript中apply、call、bind的用法之旅模式
2015/10/28 Javascript
微信小程序 解决请求服务器手机预览请求不到数据的方法
2017/01/04 Javascript
JS正则表达式验证账号、手机号、电话和邮箱是否合法
2017/03/08 Javascript
JsChart组件使用详解
2018/03/04 Javascript
深入学习python的yield和generator
2016/03/10 Python
基于Python数据可视化利器Matplotlib,绘图入门篇,Pyplot详解
2017/10/13 Python
浅谈Python中带_的变量或函数命名
2017/12/04 Python
Python中的集合介绍
2019/01/28 Python
基于Python实现船舶的MMSI的获取(推荐)
2019/10/21 Python
tensorflow的ckpt及pb模型持久化方式及转化详解
2020/02/12 Python
使用python无账号无限制获取企查查信息的实例代码
2020/04/17 Python
详解使用CSS3的@media来编写响应式的页面
2017/11/01 HTML / CSS
bareMinerals官网:矿物质化妆品和护肤品
2018/02/04 全球购物
GWT都有什么特性
2016/12/02 面试题
综合测评自我鉴定
2013/10/08 职场文书
办理生育手续介绍信
2014/01/14 职场文书
超市优秀员工获奖感言
2014/08/15 职场文书
2014年重阳节活动策划方案书
2014/09/16 职场文书
2015年团委副书记工作总结
2015/07/23 职场文书
观看安全警示教育片心得体会
2016/01/15 职场文书
oracle DGMGRL ORA-16603报错的解决方法(DG Broker)
2021/04/06 Oracle
使用goaccess分析nginx日志的详细方法
2021/07/09 Servers