用tensorflow构建线性回归模型的示例代码


Posted in Python onMarch 05, 2018

用tensorflow构建简单的线性回归模型是tensorflow的一个基础样例,但是原有的样例存在一些问题,我在实际调试的过程中做了一点自己的改进,并且有一些体会。

首先总结一下tf构建模型的总体套路

1、先定义模型的整体图结构,未知的部分,比如输入就用placeholder来代替。

2、再定义最后与目标的误差函数。

3、最后选择优化方法。

另外几个值得注意的地方是:

1、tensorflow构建模型第一步是先用代码搭建图模型,此时图模型是静止的,是不产生任何运算结果的,必须使用Session来驱动。

2、第二步根据问题的不同要求构建不同的误差函数,这个函数就是要求优化的函数。

3、调用合适的优化器优化误差函数,注意,此时反向传播调整参数的过程隐藏在了图模型当中,并没有显式显现出来。

4、tensorflow的中文意思是张量流动,也就是说有两个意思,一个是参与运算的不仅仅是标量或是矩阵,甚至可以是具有很高维度的张量,第二个意思是这些数据在图模型中流动,不停地更新。

5、session的run函数中,按照传入的操作向上查找,凡是操作中涉及的无论是变量、常量都要参与运算,占位符则要在run过程中以字典形式传入。

以上时tensorflow的一点认识,下面是关于梯度下降的一点新认识。

1、梯度下降法分为批量梯度下降和随机梯度下降法,第一种是所有数据都参与运算后,计算误差函数,根据此误差函数来更新模型参数,实际调试发现,如果定义误差函数为平方误差函数,这个值很快就会飞掉,原因是,批量平方误差都加起来可能会很大,如果此时学习率比较高,那么调整就会过,造成模型参数向一个方向大幅调整,造成最终结果发散。所以这个时候要降低学习率,让参数变化不要太快。

2、随机梯度下降法,每次用一个数据计算误差函数,然后更新模型参数,这个方法有可能会造成结果出现震荡,而且麻烦的是由于要一个个取出数据参与运算,而不是像批量计算那样采用了广播或者向量化乘法的机制,收敛会慢一些。但是速度要比使用批量梯度下降要快,原因是不需要每次计算全部数据的梯度了。比较折中的办法是mini-batch,也就是每次选用一小部分数据做梯度下降,目前这也是最为常用的方法了。

3、epoch概念:所有样本集过完一轮,就是一个epoch,很明显,如果是严格的随机梯度下降法,一个epoch内更新了样本个数这么多次参数,而批量法只更新了一次。

以上是我个人的一点认识,希望大家看到有不对的地方及时批评指针,不胜感激!

#encoding=utf-8 
__author__ = 'freedom' 
import tensorflow as tf 
import numpy as np 
 
def createData(dataNum,w,b,sigma): 
 train_x = np.arange(dataNum) 
 train_y = w*train_x+b+np.random.randn()*sigma 
 #print train_x 
 #print train_y 
 return train_x,train_y 
 
def linerRegression(train_x,train_y,epoch=100000,rate = 0.000001): 
 train_x = np.array(train_x) 
 train_y = np.array(train_y) 
 n = train_x.shape[0] 
 x = tf.placeholder("float") 
 y = tf.placeholder("float") 
 w = tf.Variable(tf.random_normal([1])) # 生成随机权重 
 b = tf.Variable(tf.random_normal([1])) 
 
 pred = tf.add(tf.mul(x,w),b) 
 loss = tf.reduce_sum(tf.pow(pred-y,2)) 
 optimizer = tf.train.GradientDescentOptimizer(rate).minimize(loss) 
 init = tf.initialize_all_variables() 
 
 sess = tf.Session() 
 sess.run(init) 
 print 'w start is ',sess.run(w) 
 print 'b start is ',sess.run(b) 
 for index in range(epoch): 
  #for tx,ty in zip(train_x,train_y): 
   #sess.run(optimizer,{x:tx,y:ty}) 
  sess.run(optimizer,{x:train_x,y:train_y}) 
  # print 'w is ',sess.run(w) 
  # print 'b is ',sess.run(b) 
  # print 'pred is ',sess.run(pred,{x:train_x}) 
  # print 'loss is ',sess.run(loss,{x:train_x,y:train_y}) 
  #print '------------------' 
 print 'loss is ',sess.run(loss,{x:train_x,y:train_y}) 
 w = sess.run(w) 
 b = sess.run(b) 
 return w,b 
 
def predictionTest(test_x,test_y,w,b): 
 W = tf.placeholder(tf.float32) 
 B = tf.placeholder(tf.float32) 
 X = tf.placeholder(tf.float32) 
 Y = tf.placeholder(tf.float32) 
 n = test_x.shape[0] 
 pred = tf.add(tf.mul(X,W),B) 
 loss = tf.reduce_mean(tf.pow(pred-Y,2)) 
 sess = tf.Session() 
 loss = sess.run(loss,{X:test_x,Y:test_y,W:w,B:b}) 
 return loss 
 
if __name__ == "__main__": 
 train_x,train_y = createData(50,2.0,7.0,1.0) 
 test_x,test_y = createData(20,2.0,7.0,1.0) 
 w,b = linerRegression(train_x,train_y) 
 print 'weights',w 
 print 'bias',b 
 loss = predictionTest(test_x,test_y,w,b) 
 print loss

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
wxPython中listbox用法实例详解
Jun 01 Python
python和shell获取文本内容的方法
Jun 05 Python
对python requests的content和text方法的区别详解
Oct 11 Python
Pandas的read_csv函数参数分析详解
Jul 02 Python
Python使用qrcode二维码库生成二维码方法详解
Feb 17 Python
python3中sorted函数里cmp参数改变详解
Mar 12 Python
Python reduce函数作用及实例解析
May 08 Python
基于Python正确读取资源文件
Sep 14 Python
Python内存泄漏和内存溢出的解决方案
Sep 26 Python
Python+OpenCV图像处理——图像二值化的实现
Oct 24 Python
python中pyplot基础图标函数整理
Nov 10 Python
python3.9.1环境安装的方法(图文)
Feb 02 Python
详解python实现线程安全的单例模式
Mar 05 #Python
分析python动态规划的递归、非递归实现
Mar 04 #Python
python3.x上post发送json数据
Mar 04 #Python
python数据封装json格式数据
Mar 04 #Python
Python爬虫实例扒取2345天气预报
Mar 04 #Python
Python爬虫设置代理IP的方法(爬虫技巧)
Mar 04 #Python
浅析python实现scrapy定时执行爬虫
Mar 04 #Python
You might like
PHP高级OOP技术演示
2009/08/27 PHP
PHP中exec与system用法区别分析
2014/09/22 PHP
PHP+MySQL实现的简单投票系统实例
2016/02/24 PHP
Yii2-GridView 中让关联字段带搜索和排序功能示例
2017/01/21 PHP
关于PHP内置的字符串处理函数详解
2017/02/04 PHP
PHP十六进制颜色随机生成器功能示例
2017/07/24 PHP
PHP下载大文件失败并限制下载速度的实例代码
2019/05/10 PHP
Javascript生成json的函数代码(可以用php的json_decode解码)
2012/06/11 Javascript
JS实现将人民币金额转换为大写的示例代码
2014/02/13 Javascript
JavaScript中日期的相关操作方法总结
2015/10/24 Javascript
jQuery动画显示和隐藏效果实例演示(附demo源码下载)
2015/12/31 Javascript
Angular Module声明和获取重载实例代码
2016/09/14 Javascript
jQuery 选择器(61种)整理总结
2016/09/26 Javascript
JavaScript实现的搜索及高亮显示功能示例
2017/08/14 Javascript
详解Web使用webpack构建前端项目
2017/09/23 Javascript
vue 动态改变静态图片以及请求网络图片的实现方法
2018/02/07 Javascript
实现一个 Vue 吸顶锚点组件方法
2019/07/10 Javascript
js+css实现扇形导航效果
2020/08/18 Javascript
[01:23]2014DOTA2国际邀请赛 球迷无处不在Ti现场世界杯受关注
2014/07/10 DOTA
举例详解Python中的split()函数的使用方法
2015/04/07 Python
用tensorflow实现弹性网络回归算法
2018/01/09 Python
PyTorch中permute的用法详解
2019/12/30 Python
django项目中使用云片网发送短信验证码的实现
2021/01/19 Python
到底Java是如何传递参数的?是by value或by reference?
2012/07/13 面试题
成都思必达公司C#程序员招聘面试题
2013/06/26 面试题
工作态度检讨书
2014/02/11 职场文书
毕业生欢送会主持词
2014/03/31 职场文书
留学推荐信范文
2014/05/10 职场文书
三八妇女节趣味活动方案
2014/08/23 职场文书
购房意向书
2014/08/30 职场文书
五四演讲稿范文
2014/09/03 职场文书
口才训练演讲稿范文
2014/09/16 职场文书
师范生见习报告范文
2014/11/03 职场文书
婚礼父母答谢词
2015/01/04 职场文书
导游词之临安白水涧
2019/11/05 职场文书
JavaScript中时间格式化新思路toLocaleString()
2021/11/07 Javascript