编程 Python

机器学习经典算法-logistic回归代码详解

Posted in Python onDecember 22, 2017

一、算法简要

我们希望有这么一种函数：接受输入然后预测出类别，这样用于分类。这里，用到了数学中的sigmoid函数，sigmoid函数的具体表达式和函数图象如下：

可以较为清楚的看到，当输入的x小于0时，函数值<0.5，将分类预测为0；当输入的x大于0时，函数值>0.5，将分类预测为1。

1.1 预测函数的表示

机器学习经典算法-logistic回归代码详解

1.2参数的求解

机器学习经典算法-logistic回归代码详解

二、代码实现

函数sigmoid计算相应的函数值；gradAscent实现的batch-梯度上升，意思就是在每次迭代中所有数据集都考虑到了；而stoGradAscent0中，则是将数据集中的示例都比那里了一遍，复杂度大大降低；stoGradAscent1则是对随机梯度上升的改进，具体变化是alpha每次变化的频率是变化的，而且每次更新参数用到的示例都是随机选取的。

from numpy import * 
import matplotlib.pyplot as plt 
def loadDataSet(): 
  dataMat = [] 
  labelMat = [] 
  fr = open('testSet.txt') 
  for line in fr.readlines(): 
    lineArr = line.strip('\n').split('\t') 
    dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])]) 
    labelMat.append(int(lineArr[2])) 
  fr.close() 
  return dataMat, labelMat 
def sigmoid(inX): 
  return 1.0/(1+exp(-inX)) 
def gradAscent(dataMatIn, classLabels): 
  dataMatrix = mat(dataMatIn) 
  labelMat = mat(classLabels).transpose() 
  m,n=shape(dataMatrix) 
  alpha = 0.001 
  maxCycles = 500 
  weights = ones((n,1)) 
  errors=[] 
  for k in range(maxCycles): 
    h = sigmoid(dataMatrix*weights) 
    error = labelMat - h 
    errors.append(sum(error)) 
    weights = weights + alpha*dataMatrix.transpose()*error 
  return weights, errors 
def stoGradAscent0(dataMatIn, classLabels): 
  m,n=shape(dataMatIn) 
  alpha = 0.01 
  weights = ones(n) 
  for i in range(m): 
    h = sigmoid(sum(dataMatIn[i]*weights)) 
    error = classLabels[i] - h  
    weights = weights + alpha*error*dataMatIn[i] 
  return weights 
def stoGradAscent1(dataMatrix, classLabels, numIter = 150): 
  m,n=shape(dataMatrix) 
  weights = ones(n) 
  for j in range(numIter): 
    dataIndex=range(m) 
    for i in range(m): 
      alpha= 4/(1.0+j+i)+0.01 
      randIndex = int(random.uniform(0,len(dataIndex))) 
      h = sigmoid(sum(dataMatrix[randIndex]*weights)) 
      error = classLabels[randIndex]-h 
      weights=weights+alpha*error*dataMatrix[randIndex] 
      del(dataIndex[randIndex]) 
    return weights 
def plotError(errs): 
  k = len(errs) 
  x = range(1,k+1) 
  plt.plot(x,errs,'g--') 
  plt.show() 
def plotBestFit(wei): 
  weights = wei.getA() 
  dataMat, labelMat = loadDataSet() 
  dataArr = array(dataMat) 
  n = shape(dataArr)[0] 
  xcord1=[] 
  ycord1=[] 
  xcord2=[] 
  ycord2=[] 
  for i in range(n):  
    if int(labelMat[i])==1: 
      xcord1.append(dataArr[i,1]) 
      ycord1.append(dataArr[i,2]) 
    else: 
      xcord2.append(dataArr[i,1]) 
      ycord2.append(dataArr[i,2]) 
  fig = plt.figure() 
  ax = fig.add_subplot(111) 
  ax.scatter(xcord1, ycord1, s=30, c='red', marker='s') 
  ax.scatter(xcord2, ycord2, s=30, c='green') 
  x = arange(-3.0,3.0,0.1) 
  y=(-weights[0]-weights[1]*x)/weights[2] 
  ax.plot(x,y) 
  plt.xlabel('x1') 
  plt.ylabel('x2') 
  plt.show() 
def classifyVector(inX, weights): 
  prob = sigmoid(sum(inX*weights)) 
  if prob>0.5: 
    return 1.0 
  else: 
    return 0 
def colicTest(ftr, fte, numIter): 
  frTrain = open(ftr) 
  frTest = open(fte) 
  trainingSet=[] 
  trainingLabels=[] 
  for line in frTrain.readlines(): 
    currLine = line.strip('\n').split('\t') 
    lineArr=[] 
    for i in range(21): 
      lineArr.append(float(currLine[i])) 
    trainingSet.append(lineArr) 
    trainingLabels.append(float(currLine[21])) 
  frTrain.close() 
  trainWeights = stoGradAscent1(array(trainingSet),trainingLabels, numIter) 
  errorCount = 0 
  numTestVec = 0.0 
  for line in frTest.readlines(): 
    numTestVec += 1.0 
    currLine = line.strip('\n').split('\t') 
    lineArr=[] 
    for i in range(21): 
      lineArr.append(float(currLine[i])) 
    if int(classifyVector(array(lineArr), trainWeights))!=int(currLine[21]): 
      errorCount += 1 
  frTest.close() 
  errorRate = (float(errorCount))/numTestVec 
  return errorRate 
def multiTest(ftr, fte, numT, numIter): 
  errors=[] 
  for k in range(numT): 
    error = colicTest(ftr, fte, numIter) 
    errors.append(error) 
  print "There "+str(len(errors))+" test with "+str(numIter)+" interations in all!" 
  for i in range(numT): 
    print "The "+str(i+1)+"th"+" testError is:"+str(errors[i]) 
  print "Average testError: ", float(sum(errors))/len(errors) 
''''' 
data, labels = loadDataSet() 
weights0 = stoGradAscent0(array(data), labels) 
weights,errors = gradAscent(data, labels) 
weights1= stoGradAscent1(array(data), labels, 500) 
print weights 
plotBestFit(weights) 
print weights0 
weights00 = [] 
for w in weights0: 
  weights00.append([w]) 
plotBestFit(mat(weights00)) 
print weights1 
weights11=[] 
for w in weights1: 
  weights11.append([w]) 
plotBestFit(mat(weights11)) 
''' 
multiTest(r"horseColicTraining.txt",r"horseColicTest.txt",10,500)

总结

以上就是本文关于机器学习经典算法-logistic回归代码详解的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站：

如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

机器学习经典算法-logistic回归代码详解

- Author -

moodytong

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python实现抓取城市的PM2.5浓度和排名

Mar 19 Python

在Python的Django框架中用流响应生成CSV文件的教程

May 02 Python

Python字符串匹配算法KMP实例

Jul 18 Python

利用Pandas 创建空的DataFrame方法

Apr 08 Python

解决Python下imread,imwrite不支持中文的问题

Dec 05 Python

django项目登录中使用图片验证码的实现方法

Aug 15 Python

应用OpenCV和Python进行SIFT算法的实现详解

Aug 21 Python

Python基于execjs运行js过程解析

Nov 27 Python

Python获取百度热搜的完整代码

Apr 07 Python

7个关于Python的经典基础案例

Nov 07 Python

详解NumPy中的线性关系与数据修剪压缩

May 25 Python

Python绘制散点图之可视化神器pyecharts

Jul 07 Python

利用python将xml文件解析成html文件的实现方法

Dec 22 #Python

python实现数据预处理之填充缺失值的示例

Dec 22 #Python

NetworkX之Prim算法(实例讲解)

Dec 22 #Python

Python实现控制台中的进度条功能代码

Dec 22 #Python

Python中的探索性数据分析(功能式)

Dec 22 #Python

Python反射用法实例简析

Dec 22 #Python

Python文本特征抽取与向量化算法学习

Dec 22 #Python

You might like

超外差式晶体管收音机的组装与统调

2021/03/01 无线电

浅谈discuz密码加密的方式

2014/05/22 PHP

Laravel如何同时连接多个数据库详解

2019/08/13 PHP

关于JavaScript中的关联数组分析

2013/04/09 Javascript

在javascript中关于节点内容加强

2013/04/11 Javascript

JS实现匀速运动的代码实例

2013/11/29 Javascript

在Ubuntu系统上安装Node.JS的教程

2015/10/15 Javascript

简单谈谈json跨域

2016/03/13 Javascript

移动适配的几种方案(三种方案)

2016/11/25 Javascript

Angular使用ng-messages与PHP进行表单数据验证

2016/12/28 Javascript

vue2.0 实现页面导航提示引导的方法

2018/03/13 Javascript

React中Ref 的使用方法详解

2020/04/28 Javascript

jQuery实现高度灵活的表单验证功能示例【无UI】

2020/04/30 jQuery

JavaScript进阶（三）闭包原理与用法详解

2020/05/09 Javascript

vue中watch和computed的区别与使用方法

2020/08/23 Javascript

[23:21]Ti4 冒泡赛第二轮DK vs C9 2

2014/07/14 DOTA

用Python实现web端用户登录和注册功能的教程

2015/04/30 Python

JSON Web Tokens的实现原理

2017/04/02 Python

Python绘制七段数码管实例代码

2017/12/20 Python

python dataframe常见操作方法:实现取行、列、切片、统计特征值

2018/06/09 Python

windows7 32、64位下python爬虫框架scrapy环境的搭建方法

2018/11/29 Python

Python基于plotly模块实现的画图操作示例

2019/01/23 Python

用python3 返回鼠标位置的实现方法(带界面)

2019/07/05 Python

django formset实现数据表的批量操作的示例代码

2019/12/06 Python

Pytorch之finetune使用详解

2020/01/18 Python

2021年值得向Python开发者推荐的VS Code扩展插件

2021/01/25 Python

英国最大的笔记本电脑直销专家：Laptops Direct

2019/07/20 全球购物

澳大利亚鞋仓库：Shoe Warehouse

2019/07/25 全球购物

Martinelli官方商店：西班牙皮鞋和高跟鞋品牌

2019/07/30 全球购物

J2EE的优越性主要表现在哪些方面

2016/03/28 面试题

最新奶茶店创业计划书范文

2014/02/08 职场文书

领导干部廉政承诺书

2014/03/27 职场文书

七一党日活动总结

2014/07/08 职场文书

人事行政部各岗位职责说明书！

2019/07/15 职场文书

好段摘抄大全（48句）

2019/08/08 职场文书

HTML+css盒子模型案例(圆，半圆等)“border-radius” 简单易上手

2021/05/10 HTML / CSS