用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案


Posted in Python onMarch 03, 2021

训练的时候当然用gpu,速度快呀。

我想用cpu版的tensorflow跑一下,结果报错,这个错误不太容易看懂。

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

大概意思是没找到一些节点。

后来发现原因,用gpu和cpu保存的pb模型不太一样,但是checkpoints文件是通用的。

使用tensorflow-cpu再把checkpoints文件重新转换一下pb文件就可以了。

完美解决!

补充:tensflow-gpu版的无数坑坑坑!(tf坑大总结)

自己的小本本,之前预装有的pycharm+win10+anaconda3+python3的环境

2019/3/24重新安装发现:目前CUDA10.1安装不了tensorflow1.13,把CUDA改为10.0即可(记得对应的cudann呀)

如果刚入坑,建议先用tensorflw学会先跑几个demo,等什么时候接受不了cpu这乌龟般的速度之时,就要开始尝试让gpu来跑了。

cpu跑tensorflow只需要在anaconda3下载。

安装cpu跑的tensorflow:

我的小本本目前已经是gpu版本,cpu版本下红圈里那个版本就好了!

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

安装好了后直接在python命令中输入

import tensorflow as tf

如果不报错说明调用成功。

查看目前tensorflow调用的是cpu还是gpu运行:

import tensorflow as tf
import numpy as np
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
print(sess.run(c))

然后把这段代码粘贴到编译器中运行,

看一下运行的结果中,调用运行的是什么

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

看给出的是gpu还是cpu就能判断目前运行的是哪一个了

安装gpu版本的tensorflow:

首先第一步要确定你的显卡是否为N卡,

然后上https://developer.nvidia.com/cuda-gpus去看看你的显卡是否被NVDIA允许跑机器学习

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

对于CUDA与cudann的安装:

需要到nvdia下载CUDA与cudann,这里最重要的是注意CUDA与cudann与tensorflow三者的搭配,

注意版本的搭配!!!

注意版本的搭配!!!

注意版本的搭配!!!

tensorflow在1.5版本以后才支持9.0以上的CUDA,所以如果CUDA版本过高,会造成找不到文件的错误。

在官网也可以看到CUDA搭配的cudann

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

在安装完了cudann时,需要把其三个文件复制到CUDA的目录下,并且添加3个新的path:

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

3个path,

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

当使用gpu版的tf时,就不再需要安装原来版本的tf,卸载了就好,安装tf-gpu版,

判断自己是否有安装tf包,对于pycharm用户,可以在setting那看看是否安装了tf-gpu

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

我使用的环境为:tf1.2+CUDA8.0+cudann5.1

当全部正确安装时

import tensorflow as tf 仍然出错

cudnn64_6.dll问题

关于导入TensorFlow找不到cudnn64_6.dll,其实下载的的是cudnn64_7.dll(版本不符合),把其修改过来就行了。

目录是在:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin下

对于不断尝试扔失败运行GPU版本,可以把tf先删除了重新下

import tensorflow as tf
print(tf.__version__)

查询tensorflow安装路径为:

print(tf.__path__)

成功用GPU运行但运行自己的代码仍然报错:

如果报错原因是这个

ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[10000,28,28,32]

最后关于这个报错是因为GPU的显存不够,此时你可以看看你的代码,是训练集加载过多还是测试集加载过多,将它一次只加载一部分即可。

对于训练集banch_xs,banch_ys = mnist.train.next_batch(1000) 改为

banch_xs,banch_ys = mnist.train.next_batch(100)即可,

而测试集呢print(compute_accuracy(mnist.test.images[:5000], mnist.test.labels[:5000])) 改为

print(compute_accuracy(mnist.test.images, mnist.test.labels))即可

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。如有错误或未考虑完全的地方,望不吝赐教。

Python 相关文章推荐
Python实现的HTTP并发测试完整示例
Apr 23 Python
python分析网页上所有超链接的方法
May 08 Python
Python中在for循环中嵌套使用if和else语句的技巧
Jun 20 Python
Python正则捕获操作示例
Aug 19 Python
Python实现批量压缩图片
Jan 25 Python
python中将一个全部为int的list 转化为str的list方法
Apr 09 Python
python截取两个单词之间的内容方法
Dec 25 Python
Anaconda 查看、创建、管理和使用python环境的方法
Dec 03 Python
Python模块/包/库安装的六种方法及区别
Feb 24 Python
基于plt.title无法显示中文的快速解决
May 16 Python
Python实现播放和录制声音的功能
Aug 12 Python
浅析Python中的套接字编程
Jun 22 Python
神经网络训练采用gpu设置的方式
Mar 03 #Python
解决TensorFlow训练模型及保存数量限制的问题
Mar 03 #Python
使paramiko库执行命令时在给定的时间强制退出功能的实现
Mar 03 #Python
python上下文管理的使用场景实例讲解
Mar 03 #Python
pip install命令安装扩展库整理
Mar 02 #Python
python实现杨辉三角的几种方法代码实例
Mar 02 #Python
python爬虫破解字体加密案例详解
Mar 02 #Python
You might like
通过ICQ网关发送手机短信的PHP源程序
2006/10/09 PHP
php session 错误
2009/05/21 PHP
PHP 字符截取 解决中文的截取问题,不用mb系列
2009/09/29 PHP
php获取URL中带#号等特殊符号参数的解决方法
2014/09/02 PHP
浅谈ThinkPHP的URL重写
2014/11/25 PHP
PHP完全二叉树定义与实现方法示例
2017/10/09 PHP
Thinkphp5行为使用方法汇总
2017/12/21 PHP
php两点地理坐标距离的计算方法
2018/12/29 PHP
如何将JS的变量值传递给ASP变量
2012/12/10 Javascript
JavaScript常用脚本汇总(二)
2015/03/04 Javascript
在Javascript中处理数组之toSource()方法的使用
2015/06/09 Javascript
JavaScript中Math.SQRT2属性的使用详解
2015/06/14 Javascript
jQuery实现自定义右键菜单的树状菜单效果
2015/09/02 Javascript
Bootstrap基本插件学习笔记之按钮(21)
2016/12/08 Javascript
[原创]SyntaxHighlighter自动识别并加载脚本语言
2017/02/07 Javascript
Vue.js实现移动端短信验证码功能
2017/03/29 Javascript
javascript+html5+css3自定义提示窗口
2017/06/21 Javascript
详解nuxt sass全局变量(公共scss解决方案)
2018/06/27 Javascript
浅谈redux, koa, express 中间件实现对比解析
2019/05/23 Javascript
vue 移动端注入骨架屏的配置方法
2019/06/25 Javascript
Vue的状态管理vuex使用方法详解
2020/02/05 Javascript
基于Element封装一个表格组件tableList的使用方法
2020/06/29 Javascript
Vue中ref和$refs的介绍以及使用方法示例
2021/01/11 Vue.js
[33:23]Secret vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/17 DOTA
python安装教程
2018/02/28 Python
TensorFlow搭建神经网络最佳实践
2018/03/09 Python
python Celery定时任务的示例
2018/03/13 Python
华为2019校招笔试题之处理字符串(python版)
2019/06/25 Python
全球最大的跑步用品商店:Road Runner Sports
2016/09/11 全球购物
职高毕业生自我鉴定
2013/10/21 职场文书
2014年护士个人工作总结
2014/11/11 职场文书
2014年语文教师工作总结
2014/12/18 职场文书
订货会邀请函
2015/01/31 职场文书
2015年支教教师工作总结
2015/07/22 职场文书
听课评课活动心得体会
2016/01/15 职场文书
2016年小学党支部创先争优活动总结
2016/04/05 职场文书