用tensorflow构建线性回归模型的示例代码


Posted in Python onMarch 05, 2018

用tensorflow构建简单的线性回归模型是tensorflow的一个基础样例,但是原有的样例存在一些问题,我在实际调试的过程中做了一点自己的改进,并且有一些体会。

首先总结一下tf构建模型的总体套路

1、先定义模型的整体图结构,未知的部分,比如输入就用placeholder来代替。

2、再定义最后与目标的误差函数。

3、最后选择优化方法。

另外几个值得注意的地方是:

1、tensorflow构建模型第一步是先用代码搭建图模型,此时图模型是静止的,是不产生任何运算结果的,必须使用Session来驱动。

2、第二步根据问题的不同要求构建不同的误差函数,这个函数就是要求优化的函数。

3、调用合适的优化器优化误差函数,注意,此时反向传播调整参数的过程隐藏在了图模型当中,并没有显式显现出来。

4、tensorflow的中文意思是张量流动,也就是说有两个意思,一个是参与运算的不仅仅是标量或是矩阵,甚至可以是具有很高维度的张量,第二个意思是这些数据在图模型中流动,不停地更新。

5、session的run函数中,按照传入的操作向上查找,凡是操作中涉及的无论是变量、常量都要参与运算,占位符则要在run过程中以字典形式传入。

以上时tensorflow的一点认识,下面是关于梯度下降的一点新认识。

1、梯度下降法分为批量梯度下降和随机梯度下降法,第一种是所有数据都参与运算后,计算误差函数,根据此误差函数来更新模型参数,实际调试发现,如果定义误差函数为平方误差函数,这个值很快就会飞掉,原因是,批量平方误差都加起来可能会很大,如果此时学习率比较高,那么调整就会过,造成模型参数向一个方向大幅调整,造成最终结果发散。所以这个时候要降低学习率,让参数变化不要太快。

2、随机梯度下降法,每次用一个数据计算误差函数,然后更新模型参数,这个方法有可能会造成结果出现震荡,而且麻烦的是由于要一个个取出数据参与运算,而不是像批量计算那样采用了广播或者向量化乘法的机制,收敛会慢一些。但是速度要比使用批量梯度下降要快,原因是不需要每次计算全部数据的梯度了。比较折中的办法是mini-batch,也就是每次选用一小部分数据做梯度下降,目前这也是最为常用的方法了。

3、epoch概念:所有样本集过完一轮,就是一个epoch,很明显,如果是严格的随机梯度下降法,一个epoch内更新了样本个数这么多次参数,而批量法只更新了一次。

以上是我个人的一点认识,希望大家看到有不对的地方及时批评指针,不胜感激!

#encoding=utf-8 
__author__ = 'freedom' 
import tensorflow as tf 
import numpy as np 
 
def createData(dataNum,w,b,sigma): 
 train_x = np.arange(dataNum) 
 train_y = w*train_x+b+np.random.randn()*sigma 
 #print train_x 
 #print train_y 
 return train_x,train_y 
 
def linerRegression(train_x,train_y,epoch=100000,rate = 0.000001): 
 train_x = np.array(train_x) 
 train_y = np.array(train_y) 
 n = train_x.shape[0] 
 x = tf.placeholder("float") 
 y = tf.placeholder("float") 
 w = tf.Variable(tf.random_normal([1])) # 生成随机权重 
 b = tf.Variable(tf.random_normal([1])) 
 
 pred = tf.add(tf.mul(x,w),b) 
 loss = tf.reduce_sum(tf.pow(pred-y,2)) 
 optimizer = tf.train.GradientDescentOptimizer(rate).minimize(loss) 
 init = tf.initialize_all_variables() 
 
 sess = tf.Session() 
 sess.run(init) 
 print 'w start is ',sess.run(w) 
 print 'b start is ',sess.run(b) 
 for index in range(epoch): 
  #for tx,ty in zip(train_x,train_y): 
   #sess.run(optimizer,{x:tx,y:ty}) 
  sess.run(optimizer,{x:train_x,y:train_y}) 
  # print 'w is ',sess.run(w) 
  # print 'b is ',sess.run(b) 
  # print 'pred is ',sess.run(pred,{x:train_x}) 
  # print 'loss is ',sess.run(loss,{x:train_x,y:train_y}) 
  #print '------------------' 
 print 'loss is ',sess.run(loss,{x:train_x,y:train_y}) 
 w = sess.run(w) 
 b = sess.run(b) 
 return w,b 
 
def predictionTest(test_x,test_y,w,b): 
 W = tf.placeholder(tf.float32) 
 B = tf.placeholder(tf.float32) 
 X = tf.placeholder(tf.float32) 
 Y = tf.placeholder(tf.float32) 
 n = test_x.shape[0] 
 pred = tf.add(tf.mul(X,W),B) 
 loss = tf.reduce_mean(tf.pow(pred-Y,2)) 
 sess = tf.Session() 
 loss = sess.run(loss,{X:test_x,Y:test_y,W:w,B:b}) 
 return loss 
 
if __name__ == "__main__": 
 train_x,train_y = createData(50,2.0,7.0,1.0) 
 test_x,test_y = createData(20,2.0,7.0,1.0) 
 w,b = linerRegression(train_x,train_y) 
 print 'weights',w 
 print 'bias',b 
 loss = predictionTest(test_x,test_y,w,b) 
 print loss

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现获取操作系统版本信息方法
Apr 08 Python
Python生成随机验证码的两种方法
Dec 22 Python
Python使用迭代器打印螺旋矩阵的思路及代码示例
Jul 02 Python
Python heapq使用详解及实例代码
Jan 25 Python
关于Python 3中print函数的换行详解
Aug 08 Python
python实现用户答题功能
Jan 17 Python
Python实现高斯函数的三维显示方法
Dec 29 Python
Python virtualenv虚拟环境实现过程解析
Apr 18 Python
pytorch判断是否cuda 判断变量类型方式
Jun 23 Python
基于python实现操作git过程代码解析
Jul 27 Python
python利用platform模块获取系统信息
Oct 09 Python
Python类class参数self原理解析
Nov 19 Python
详解python实现线程安全的单例模式
Mar 05 #Python
分析python动态规划的递归、非递归实现
Mar 04 #Python
python3.x上post发送json数据
Mar 04 #Python
python数据封装json格式数据
Mar 04 #Python
Python爬虫实例扒取2345天气预报
Mar 04 #Python
Python爬虫设置代理IP的方法(爬虫技巧)
Mar 04 #Python
浅析python实现scrapy定时执行爬虫
Mar 04 #Python
You might like
使用PHP实现二分查找算法代码分享
2011/06/24 PHP
解析php5配置使用pdo
2013/07/03 PHP
PHP使用mysqldump命令导出数据库
2015/04/14 PHP
PHP 实现页面静态化的几种方法
2017/07/23 PHP
jQuery之网页换肤实现代码
2011/04/30 Javascript
用Javascript评估用户输入密码的强度实现代码
2011/11/30 Javascript
JS加jquery简单实现标签元素的显示或隐藏
2013/09/23 Javascript
jQuery实现列表的全选功能
2015/03/18 Javascript
jQuery实现区域打印功能代码详解
2016/06/17 Javascript
javascript的document中的动态添加标签实现方法
2016/10/24 Javascript
JavaScript中七种流行的开源机器学习框架
2018/10/11 Javascript
vue+iview/elementUi实现城市多选
2019/03/28 Javascript
原生JS实现图片懒加载之页面性能优化
2019/04/26 Javascript
vue使用nprogress实现进度条
2019/12/09 Javascript
Vue 实现分页与输入框关键字筛选功能
2020/01/02 Javascript
Nodejs实现微信分账的示例代码
2021/01/19 NodeJs
介绍Python中内置的itertools模块
2015/04/29 Python
Python实现批量读取word中表格信息的方法
2015/07/30 Python
Eclipse中Python开发环境搭建简单教程
2016/03/23 Python
Python爬虫抓取代理IP并检验可用性的实例
2018/05/07 Python
通过python爬虫赚钱的方法
2019/01/29 Python
Python3开发实例之非关系型图数据库Neo4j安装方法及Python3连接操作Neo4j方法实例
2020/03/18 Python
Jupyter Notebook 安装配置与使用详解
2021/01/06 Python
CSS3教程(5):网页背景图片
2009/04/02 HTML / CSS
html5的画布canvas——画出弧线、旋转的图形实例代码+效果图
2013/06/09 HTML / CSS
俄罗斯在线购买飞机票、火车票、巴士票网站:Tutu.ru
2020/03/16 全球购物
哈理工毕业生的求职信
2013/12/22 职场文书
马云的职业生涯规划之路
2014/01/01 职场文书
企业总经理职责
2014/02/02 职场文书
小组口号大全
2014/06/09 职场文书
个人作风建设心得体会
2014/10/22 职场文书
《改造我们的学习》心得体会
2014/11/07 职场文书
基于Python绘制子图及子图刻度的变换等的问题
2021/05/23 Python
python自动计算图像数据集的RGB均值
2021/06/18 Python
解决Python保存文件名太长OSError: [Errno 36] File name too long
2022/05/11 Python
js面向对象编程OOP及函数式编程FP区别
2022/07/07 Javascript