jupyter notebook 使用过程中python莫名崩溃的原因及解决方式


Posted in Python onApril 10, 2020

最近在使用 Python notebook时老是出现python崩溃的现象,如下图,诱发的原因是“KERNELBASE.dll”,异常代码报“40000015”。

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

折腾半天,发现我启动notebook时是用自定义startup.bat方式方式启动的,bat文件的内容为

start C:\Anaconda3\python.exe "C:/Anaconda3/Scripts/jupyter-notebook-script.py"

平时双击这个bat文件就行了,如果报这个莫名的错误,是因为权限不对,需要用管理员方式运行,如图,问题解决!

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

补充知识:jupyter notebook占用内存空间过大打不开的解决办法(包括但不限于爬虫造成的)

jupyter notebook由于超过内存限制而“锁死”的解决
这两天用爬虫爬数据的时候由于print了大量的爬取内容,让notebook内存溢出停止运行,连带着localhost:8888也崩溃了。Google Chrome的处理机制应该是杀掉内存溢出的页面,所以localhost:8888刷新一下就恢复了。

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

但是!我的code找不回来了!不知道是什么机制,在文件里看到的大小只有不到45MB,但是一旦从localhost:8888里面打开,(用任务管理器看的)Chrome占用的内存就远远超过这个数字,一直飙升到3GB的时候再次弹出来内存不足的提示,同时页面被杀掉。用pycharm尝试更是失败,比Chrome还吃内存。

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

在经历了各种尝试,上网搜了也没有发现相关情况之后,自己偶然发现了解决办法:

如何打开源文件:

在ipynb文件的地方选择打开方式,用Chrome浏览器打开,页面的观感类似于网页源码,内容是json格式的。

我能想到的几种解决办法:

第一种是笨办法(核心思想:只要能够打开源文件就可以把需要的东西复制下来),把重要的代码复制出来,比如到txt文件里面,再把格式用的一些字符去掉,如果代码量不是很多可以这样做;

这是一定能成功的办法,就是麻烦了一些,就不多说了。

第二种是重新构造一个json文件(核心思想:既然我已经知道ipynb本质是json就可以仿造构建一个可以打开的ipynb),导致问题的只是一个block,所以把有问题的block之外的所有block信息复制到一个txt文件,再重命名成ipynb,用jupyter notebook解析出来即可(甚至还可以直接继续运行);

实际可行性:我是用的第二种办法,实测可行,简单快捷。要注意的是一定要把最末尾的ipynb格式信息复制上。知道ipynb构造之后,觉得自己也能写个网页打开ipynb的程序了(大误)

第三种思想是用Python直接读取ipynb文件,然后小心地把重要代码和结果还原。(核心思想:不管后缀名是什么,只要里面是json格式就可以用Python的json包load),这种方法一定要注意的一点是,要观察好json文件里面的构造,不要全部print!不要全部print!之前怎么死的还不长记性吗?只要一print之前内存溢出的block就全部玩儿完,就又有了一个被锁死的ipynb文件。

理论可行性:文件本身的大小只有几十MB,轻轻松松就能存下,内存溢出可能是因为print的内容在网页中占用的资源成倍增加。我没有尝试这么做,因为随时需要存档备份,小心脏受不了。

看到这儿基本上问题就应该解决了,下面补充一点问题来源和教训

前因后果:为什么会内存溢出

这是一个“雄心勃勃”的爬虫,要爬的东西很多,所以会长时间运行。由于微博的反爬做的很好,我不确定什么时候会被屏蔽,同时需要debug嘛,所以就隔一段时间print爬到的网页。另外为了观察进度还用了tqdm(非常好用,墙裂推荐),是为print的另一部分内容。时间积累了很久(大概两天多)就卡崩溃了。

经验教训:

1、执行正式文件的时候还是最好备份一下,这次出问题我的结果是保存在文件里面的,是code打不开了,由于是孤本所以还是有点慌的(主要是跟微博斗智斗勇那么多天不想再搞了)

2、可以试着在文件里面写入日志,简单的就print也没关系,这种长时间运行的程序还是需要考虑周全一点

附一个ipynb文件源文件格式示例:

内容是hello world!

{
“cells”: [
{
“cell_type”: “code”,
“execution_count”: 1,
“metadata”: {},
“outputs”: [
{
“name”: “stdout”,
“output_type”: “stream”,
“text”: [
“hello world!\n”
]
}
],
“source”: [
“print(‘hello world!')”
]
},
{
“cell_type”: “code”,
“execution_count”: null,
“metadata”: {},
“outputs”: [],
“source”: []
}
],
“metadata”: {
“kernelspec”: {
“display_name”: “Python 3”,
“language”: “python”,
“name”: “python3”
},
“language_info”: {
“codemirror_mode”: {
“name”: “ipython”,
“version”: 3
},
“file_extension”: “.py”,
“mimetype”: “text/x-python”,
“name”: “python”,
“nbconvert_exporter”: “python”,
“pygments_lexer”: “ipython3”,
“version”: “3.7.3”
}
},
“nbformat”: 4,
“nbformat_minor”: 2
}

以上这篇jupyter notebook 使用过程中python莫名崩溃的原因及解决方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python将html转成PDF的实现代码(包含中文)
Mar 04 Python
下载安装setuptool和pip linux安装pip    
Jan 24 Python
简单介绍Python的轻便web框架Bottle
Apr 08 Python
python动态性强类型用法实例
May 09 Python
Windows下Python2与Python3两个版本共存的方法详解
Feb 12 Python
Python构建XML树结构的方法示例
Jun 30 Python
Python2.X/Python3.X中urllib库区别讲解
Dec 19 Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 Python
Python中函数参数匹配模型详解
Jun 09 Python
python 计算数据偏差和峰度的方法
Jun 29 Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 Python
Python爬虫抓取指定网页图片代码实例
Jul 24 Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
Apr 10 #Python
jupyter notebook 参数传递给shell命令行实例
Apr 10 #Python
调整Jupyter notebook的启动目录操作
Apr 10 #Python
解决jupyter notebook显示不全出现框框或者乱码问题
Apr 09 #Python
jupyter 实现notebook中显示完整的行和列
Apr 09 #Python
jupyter notebook 多行输出实例
Apr 09 #Python
Python opencv相机标定实现原理及步骤详解
Apr 09 #Python
You might like
如何利用PHP执行.SQL文件
2013/07/05 PHP
php实现的DateDiff和DateAdd时间函数代码分享
2014/08/16 PHP
Thinkphp 3.2框架使用Redis的方法详解
2019/10/24 PHP
JavaScript 继承的实现
2009/07/09 Javascript
js页面跳转常用的几种方式
2010/11/25 Javascript
JavaScript 用Node.js写Shell脚本[译]
2012/09/20 Javascript
主页面中的两个iframe实现鼠标拖动改变其大小
2013/04/16 Javascript
JsRender实用入门教程
2014/10/31 Javascript
JavaScript实现的内存数据库LokiJS介绍和入门实例
2014/11/17 Javascript
Javascript writable特性介绍
2015/02/27 Javascript
jQuery CSS3相结合实现时钟插件
2016/01/08 Javascript
jquery ajax双击div可直接修改div中的内容
2016/03/04 Javascript
JS基础随笔(菜鸟必看篇)
2016/07/13 Javascript
微信js-sdk地理位置接口用法示例
2016/10/12 Javascript
JavaScript实现前端实时搜索功能
2020/03/26 Javascript
html5+canvas实现支持触屏的签名插件教程
2017/05/08 Javascript
JavaScript编写的网页小游戏,很给力
2017/08/18 Javascript
20170918 前端开发周报之JS前端开发必看
2017/09/18 Javascript
浅谈基于Vue.js的移动组件库cube-ui
2017/12/20 Javascript
jQuery操作动画完整实例分析
2020/01/10 jQuery
如何在selenium中使用js实现定位
2020/08/18 Javascript
解决js中的setInterval清空定时器不管用问题
2020/11/17 Javascript
Python 绘制酷炫的三维图步骤详解
2019/07/12 Python
浅谈Python 敏感词过滤的实现
2019/08/15 Python
Win10下配置tensorflow-gpu的详细教程(无VS2015/2017)
2020/07/14 Python
使用layui框架实现点击左侧导航切换右侧内容且右侧选项卡跟随变化的效果
2020/11/10 HTML / CSS
历史学专业毕业生求职信
2013/09/27 职场文书
经典大学生求职信范文
2014/01/06 职场文书
校园歌咏比赛主持词
2014/03/18 职场文书
放飞中国梦演讲稿
2014/04/23 职场文书
网络销售员岗位职责
2015/04/11 职场文书
结婚堵门保证书
2015/05/08 职场文书
收入证明范本
2015/06/12 职场文书
银行求职信怎么写
2019/06/20 职场文书
Django rest framework如何自定义用户表
2021/06/09 Python
详解CSS中的特指度和层叠问题
2021/07/15 HTML / CSS