编程 Python

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

Posted in Python onMarch 03, 2021

训练的时候当然用gpu，速度快呀。

我想用cpu版的tensorflow跑一下，结果报错，这个错误不太容易看懂。

大概意思是没找到一些节点。

后来发现原因，用gpu和cpu保存的pb模型不太一样，但是checkpoints文件是通用的。

使用tensorflow-cpu再把checkpoints文件重新转换一下pb文件就可以了。

完美解决！

补充：tensflow-gpu版的无数坑坑坑！（tf坑大总结）

自己的小本本，之前预装有的pycharm+win10+anaconda3+python3的环境

2019/3/24重新安装发现：目前CUDA10.1安装不了tensorflow1.13，把CUDA改为10.0即可（记得对应的cudann呀）

如果刚入坑，建议先用tensorflw学会先跑几个demo，等什么时候接受不了cpu这乌龟般的速度之时，就要开始尝试让gpu来跑了。

cpu跑tensorflow只需要在anaconda3下载。

安装cpu跑的tensorflow:

我的小本本目前已经是gpu版本，cpu版本下红圈里那个版本就好了！

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

安装好了后直接在python命令中输入

import tensorflow as tf

如果不报错说明调用成功。

查看目前tensorflow调用的是cpu还是gpu运行：

import tensorflow as tf
import numpy as np
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
print(sess.run(c))

然后把这段代码粘贴到编译器中运行，

看一下运行的结果中，调用运行的是什么

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

看给出的是gpu还是cpu就能判断目前运行的是哪一个了

安装gpu版本的tensorflow:

首先第一步要确定你的显卡是否为N卡，

然后上https://developer.nvidia.com/cuda-gpus去看看你的显卡是否被NVDIA允许跑机器学习

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

对于CUDA与cudann的安装：

需要到nvdia下载CUDA与cudann，这里最重要的是注意CUDA与cudann与tensorflow三者的搭配，

注意版本的搭配！！！

tensorflow在1.5版本以后才支持9.0以上的CUDA，所以如果CUDA版本过高，会造成找不到文件的错误。

在官网也可以看到CUDA搭配的cudann

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

在安装完了cudann时，需要把其三个文件复制到CUDA的目录下，并且添加3个新的path：

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

3个path，

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

当使用gpu版的tf时，就不再需要安装原来版本的tf，卸载了就好，安装tf-gpu版，

判断自己是否有安装tf包，对于pycharm用户，可以在setting那看看是否安装了tf-gpu

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

我使用的环境为：tf1.2+CUDA8.0+cudann5.1

当全部正确安装时

import tensorflow as tf 仍然出错

cudnn64_6.dll问题

关于导入TensorFlow找不到cudnn64_6.dll，其实下载的的是cudnn64_7.dll（版本不符合），把其修改过来就行了。

目录是在：C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin下

对于不断尝试扔失败运行GPU版本，可以把tf先删除了重新下

import tensorflow as tf
print(tf.__version__)

查询tensorflow安装路径为:

print(tf.__path__)

成功用GPU运行但运行自己的代码仍然报错：

如果报错原因是这个

ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[10000,28,28,32]

最后关于这个报错是因为GPU的显存不够，此时你可以看看你的代码，是训练集加载过多还是测试集加载过多，将它一次只加载一部分即可。

对于训练集banch_xs,banch_ys = mnist.train.next_batch(1000) 改为

banch_xs,banch_ys = mnist.train.next_batch(100)即可，

而测试集呢print(compute_accuracy(mnist.test.images[:5000], mnist.test.labels[:5000])) 改为

print(compute_accuracy(mnist.test.images, mnist.test.labels))即可

以上为个人经验，希望能给大家一个参考，也希望大家多多支持三水点靠木。如有错误或未考虑完全的地方，望不吝赐教。

用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案

- Author -

wander_ing

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

精确查找PHP WEBSHELL木马的方法(1)

Apr 12 Python

Python set集合类型操作总结

Nov 07 Python

分析Python编程时利用wxPython来支持多线程的方法

Apr 07 Python

Python探索之SocketServer详解

Oct 28 Python

Python Excel处理库openpyxl使用详解

May 09 Python

python3爬取torrent种子链接实例

Jan 16 Python

python else语句在循环中的运用详解

Jul 06 Python

python 6行代码制作月历生成器

Sep 18 Python

python 贪心算法的实现

Sep 18 Python

全网最详细的PyCharm+Anaconda的安装过程图解

Jan 25 Python

Python爬虫之爬取某文库文档数据

Apr 21 Python

python自动获取微信公众号最新文章的实现代码

Jul 15 Python

神经网络训练采用gpu设置的方式

Mar 03 #Python

解决TensorFlow训练模型及保存数量限制的问题

Mar 03 #Python

使paramiko库执行命令时在给定的时间强制退出功能的实现

Mar 03 #Python

python上下文管理的使用场景实例讲解

Mar 03 #Python

pip install命令安装扩展库整理

Mar 02 #Python

python实现杨辉三角的几种方法代码实例

Mar 02 #Python

python爬虫破解字体加密案例详解

Mar 02 #Python

You might like

php 中include()与require()的对比

2006/10/09 PHP

php 模拟POST|GET操作实现代码

2010/07/20 PHP

浅谈PHP解析URL函数parse_url和parse_str

2014/11/11 PHP

php写入数据到CSV文件的方法

2015/03/14 PHP

PHP实现伪静态方法汇总

2016/01/13 PHP

php中钩子(hook)的原理与简单应用demo示例

2019/09/03 PHP

laravel Validator ajax返回错误信息的方法

2019/09/29 PHP

node.js中的fs.linkSync方法使用说明

2014/12/15 Javascript

JavaScript类型系统之Object详解

2016/01/07 Javascript

AngularJS在IE8的不支持的解决方法

2016/05/13 Javascript

全面了解javascript中的错误处理机制

2016/07/18 Javascript

用js写的一个路由(简单实例)

2016/09/24 Javascript

基于JS分页控件实现简单美观仿淘宝分页按钮效果

2016/11/07 Javascript

vue中如何引入jQuery和Bootstrap

2017/04/10 jQuery

nodejs body-parser 解析post数据实例

2017/07/26 NodeJs

Vue中建立全局引用或者全局命令的方法

2017/08/21 Javascript

Koa2微信公众号开发之本地开发调试环境搭建

2018/05/16 Javascript

Angularjs实现数组随机排序的方法

2018/10/02 Javascript

vue项目中实现的微信分享功能示例

2019/01/21 Javascript

JavaScript中的类型检查

2020/02/03 Javascript

JSON stringify方法原理及实例解析

2020/10/23 Javascript

解决VUE 在IE下出现ReferenceError: Promise未定义的问题

2020/11/07 Javascript

[52:06]FNATIC vs NIP 2019国际邀请赛小组赛 BO2 第二场 8.16

2019/08/19 DOTA

Python中输出ASCII大文字、艺术字、字符字小技巧

2015/04/28 Python

Python面向对象编程基础解析（一）

2017/10/26 Python

Python爬虫实现百度图片自动下载

2018/02/04 Python

Python 函数返回值的示例代码

2019/03/11 Python

pytorch点乘与叉乘示例讲解

2019/12/27 Python

Python用Jira库来操作Jira

2020/12/28 Python

荷兰家电购物网站：Expert.nl

2020/01/18 全球购物

车间工艺员岗位职责

2013/12/09 职场文书

业务员的岗位职责

2014/03/15 职场文书

小学教师先进事迹材料

2014/12/15 职场文书

CSS实现多个元素在盒子内两端对齐效果

2021/03/30 HTML / CSS

利用前端HTML+CSS+JS开发简单的TODOLIST功能（记事本）

2021/04/13 Javascript

linux中nohup和后台运行进程查看及终止

2021/06/24 Python