用tensorflow构建线性回归模型的示例代码


Posted in Python onMarch 05, 2018

用tensorflow构建简单的线性回归模型是tensorflow的一个基础样例,但是原有的样例存在一些问题,我在实际调试的过程中做了一点自己的改进,并且有一些体会。

首先总结一下tf构建模型的总体套路

1、先定义模型的整体图结构,未知的部分,比如输入就用placeholder来代替。

2、再定义最后与目标的误差函数。

3、最后选择优化方法。

另外几个值得注意的地方是:

1、tensorflow构建模型第一步是先用代码搭建图模型,此时图模型是静止的,是不产生任何运算结果的,必须使用Session来驱动。

2、第二步根据问题的不同要求构建不同的误差函数,这个函数就是要求优化的函数。

3、调用合适的优化器优化误差函数,注意,此时反向传播调整参数的过程隐藏在了图模型当中,并没有显式显现出来。

4、tensorflow的中文意思是张量流动,也就是说有两个意思,一个是参与运算的不仅仅是标量或是矩阵,甚至可以是具有很高维度的张量,第二个意思是这些数据在图模型中流动,不停地更新。

5、session的run函数中,按照传入的操作向上查找,凡是操作中涉及的无论是变量、常量都要参与运算,占位符则要在run过程中以字典形式传入。

以上时tensorflow的一点认识,下面是关于梯度下降的一点新认识。

1、梯度下降法分为批量梯度下降和随机梯度下降法,第一种是所有数据都参与运算后,计算误差函数,根据此误差函数来更新模型参数,实际调试发现,如果定义误差函数为平方误差函数,这个值很快就会飞掉,原因是,批量平方误差都加起来可能会很大,如果此时学习率比较高,那么调整就会过,造成模型参数向一个方向大幅调整,造成最终结果发散。所以这个时候要降低学习率,让参数变化不要太快。

2、随机梯度下降法,每次用一个数据计算误差函数,然后更新模型参数,这个方法有可能会造成结果出现震荡,而且麻烦的是由于要一个个取出数据参与运算,而不是像批量计算那样采用了广播或者向量化乘法的机制,收敛会慢一些。但是速度要比使用批量梯度下降要快,原因是不需要每次计算全部数据的梯度了。比较折中的办法是mini-batch,也就是每次选用一小部分数据做梯度下降,目前这也是最为常用的方法了。

3、epoch概念:所有样本集过完一轮,就是一个epoch,很明显,如果是严格的随机梯度下降法,一个epoch内更新了样本个数这么多次参数,而批量法只更新了一次。

以上是我个人的一点认识,希望大家看到有不对的地方及时批评指针,不胜感激!

#encoding=utf-8 
__author__ = 'freedom' 
import tensorflow as tf 
import numpy as np 
 
def createData(dataNum,w,b,sigma): 
 train_x = np.arange(dataNum) 
 train_y = w*train_x+b+np.random.randn()*sigma 
 #print train_x 
 #print train_y 
 return train_x,train_y 
 
def linerRegression(train_x,train_y,epoch=100000,rate = 0.000001): 
 train_x = np.array(train_x) 
 train_y = np.array(train_y) 
 n = train_x.shape[0] 
 x = tf.placeholder("float") 
 y = tf.placeholder("float") 
 w = tf.Variable(tf.random_normal([1])) # 生成随机权重 
 b = tf.Variable(tf.random_normal([1])) 
 
 pred = tf.add(tf.mul(x,w),b) 
 loss = tf.reduce_sum(tf.pow(pred-y,2)) 
 optimizer = tf.train.GradientDescentOptimizer(rate).minimize(loss) 
 init = tf.initialize_all_variables() 
 
 sess = tf.Session() 
 sess.run(init) 
 print 'w start is ',sess.run(w) 
 print 'b start is ',sess.run(b) 
 for index in range(epoch): 
  #for tx,ty in zip(train_x,train_y): 
   #sess.run(optimizer,{x:tx,y:ty}) 
  sess.run(optimizer,{x:train_x,y:train_y}) 
  # print 'w is ',sess.run(w) 
  # print 'b is ',sess.run(b) 
  # print 'pred is ',sess.run(pred,{x:train_x}) 
  # print 'loss is ',sess.run(loss,{x:train_x,y:train_y}) 
  #print '------------------' 
 print 'loss is ',sess.run(loss,{x:train_x,y:train_y}) 
 w = sess.run(w) 
 b = sess.run(b) 
 return w,b 
 
def predictionTest(test_x,test_y,w,b): 
 W = tf.placeholder(tf.float32) 
 B = tf.placeholder(tf.float32) 
 X = tf.placeholder(tf.float32) 
 Y = tf.placeholder(tf.float32) 
 n = test_x.shape[0] 
 pred = tf.add(tf.mul(X,W),B) 
 loss = tf.reduce_mean(tf.pow(pred-Y,2)) 
 sess = tf.Session() 
 loss = sess.run(loss,{X:test_x,Y:test_y,W:w,B:b}) 
 return loss 
 
if __name__ == "__main__": 
 train_x,train_y = createData(50,2.0,7.0,1.0) 
 test_x,test_y = createData(20,2.0,7.0,1.0) 
 w,b = linerRegression(train_x,train_y) 
 print 'weights',w 
 print 'bias',b 
 loss = predictionTest(test_x,test_y,w,b) 
 print loss

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 正则式 概述及常用字符
May 07 Python
python处理大数字的方法
May 27 Python
python编程开发之textwrap文本样式处理技巧
Nov 13 Python
DataFrame中的object转换成float的方法
Apr 10 Python
Python中staticmethod和classmethod的作用与区别
Oct 11 Python
利用Python求阴影部分的面积实例代码
Dec 05 Python
python函数参数(必须参数、可变参数、关键字参数)
Aug 16 Python
python 读取更新中的log 或其它文本方式
Dec 24 Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 Python
Python关键字及可变参数*args,**kw原理解析
Apr 04 Python
使用OpenCV去除面积较小的连通域
Jul 05 Python
分享一个python的aes加密代码
Dec 22 Python
详解python实现线程安全的单例模式
Mar 05 #Python
分析python动态规划的递归、非递归实现
Mar 04 #Python
python3.x上post发送json数据
Mar 04 #Python
python数据封装json格式数据
Mar 04 #Python
Python爬虫实例扒取2345天气预报
Mar 04 #Python
Python爬虫设置代理IP的方法(爬虫技巧)
Mar 04 #Python
浅析python实现scrapy定时执行爬虫
Mar 04 #Python
You might like
发布一个用PHP fsockopen写的HTTP下载的类
2007/02/22 PHP
php面向对象中static静态属性与方法的内存位置分析
2015/02/08 PHP
Gambit vs ForZe BO3 第三场 2.13
2021/03/10 DOTA
javascript背投广告代码的完善
2008/04/08 Javascript
javascript 避免闭包引发的问题
2009/03/17 Javascript
innerhtml用法 innertext用法 以及innerHTML与innertext的区别
2009/10/26 Javascript
ExtJs使用IFrame的实现代码
2010/03/24 Javascript
jQuery学习基础知识小结
2010/11/25 Javascript
javascript动态设置样式style实例分析
2015/05/13 Javascript
浅谈JavaScript变量的自动转换和语句
2016/06/12 Javascript
JavaScript基础之this详解
2017/06/04 Javascript
node实现生成带参数的小程序二维码并保存到本地功能示例
2018/12/05 Javascript
JS图片懒加载技术实现过程解析
2020/07/27 Javascript
关于Vue中$refs的探索浅析
2020/11/05 Javascript
详解Vue中的watch和computed
2020/11/09 Javascript
微信小程序实现音乐播放页面布局
2020/12/11 Javascript
使用python实现strcmp函数功能示例
2014/03/25 Python
Python实现将数据库一键导出为Excel表格的实例
2016/12/30 Python
Django + Uwsgi + Nginx 实现生产环境部署的方法
2018/06/20 Python
Python使用pymysql从MySQL数据库中读出数据的方法
2018/07/25 Python
python实现简易数码时钟
2021/02/19 Python
Python装饰器限制函数运行时间超时则退出执行
2019/04/09 Python
Python 给定的经纬度标注在地图上的实现方法
2019/07/05 Python
对Django中内置的User模型实例详解
2019/08/16 Python
Python 中的 import 机制之实现远程导入模块
2019/10/29 Python
OpenCV+Python--RGB转HSI的实现
2019/11/27 Python
解决django接口无法通过ip进行访问的问题
2020/03/27 Python
python+requests实现接口测试的完整步骤
2020/10/27 Python
PyCharm 解决找不到新打开项目的窗口问题
2021/01/15 Python
美国最大网上鞋店:Zappos
2016/07/25 全球购物
大码女装:Ulla Popken
2019/08/06 全球购物
美国家居用品和厨具购物网站:DealsDot
2019/10/07 全球购物
应用数学专业求职信
2014/03/14 职场文书
学习十八大标语
2014/10/09 职场文书
2016年度师德标兵先进事迹材料
2016/02/26 职场文书
少儿励志名言(80句)
2019/08/14 职场文书