pycharm下打开、执行并调试scrapy爬虫程序的方法


Posted in Python onNovember 29, 2017

首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1

pycharm下打开、执行并调试scrapy爬虫程序的方法

目录结构如下:

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开Pycharm,选择open

pycharm下打开、执行并调试scrapy爬虫程序的方法

选择项目,ok

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开如下界面之后,按alt + 1, 打开project 面板

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1/spiders/,文件夹下,新建一个爬虫spider.py, 注意代码中的name="dmoz"。这个名字后面会用到。

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1目录和scrapy.cfg同级目录下面,新建一个begin.py文件(便于理解可以写成main.py),注意箭头2所指的名字和第5步中的name='dmoz'名字是一样的。

from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())

pycharm下打开、执行并调试scrapy爬虫程序的方法

7. 上面把文件搞定了,下面要配置一下pycharm了。点击Run->Edit Configurations

pycharm下打开、执行并调试scrapy爬虫程序的方法

8. 新建一个运行的python模块

pycharm下打开、执行并调试scrapy爬虫程序的方法

9. Name:改成spider; script:选择刚才新建的那个begin.py文件;Working Direciton:改成自己的工作目录

pycharm下打开、执行并调试scrapy爬虫程序的方法

10. 至此,大功告成了,点击下图,右上角的按钮就能运行了。

pycharm下打开、执行并调试scrapy爬虫程序的方法

调试

可以在其他代码中设置断点,就可以debug运行

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

遇到问题

1. Unknown command: crawl

调试运行,断点并未命中,控制台输出信息如下:

H:\Python\Python36\python.exe "H:\Program Files (x86)\JetBrains\PyCharm Community Edition 4.5.4\helpers\pydev\pydevd.py" --multiproc --client 127.0.0.1 --port 59810 --file H:/Python/Python36/Lib/site-packages/scrapy/cmdline.py crawl quotes -o quotes.jl
pydev debugger: process 4740 is connecting

Connected to pydev debugger (build 141.3058)
Scrapy 1.3.2 - no active project

Unknown command: crawl

Use "scrapy" to see available commands

Process finished with exit code 2

工作目录设置有误,造成无法识别 scrapy 命令,按照上文所说,将工作目录设置为包含 scrapy.cfg,重新运行,问题解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python解析xml成对应的html示例分享
Apr 02 Python
Python格式化压缩后的JS文件的方法
Mar 05 Python
Python实战小程序利用matplotlib模块画图代码分享
Dec 09 Python
NumPy 如何生成多维数组的方法
Feb 05 Python
python基于http下载视频或音频
Jun 20 Python
python自动保存百度盘资源到百度盘中的实例代码
Aug 26 Python
python求最大公约数和最小公倍数的简单方法
Feb 13 Python
基于Python 的语音重采样函数解析
Jul 06 Python
QT5 Designer 打不开的问题及解决方法
Aug 20 Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 Python
PyQt 如何创建自定义QWidget
Mar 24 Python
python爬虫--selenium模块
Mar 31 Python
Python快速排序算法实例分析
Nov 29 #Python
Python3学习urllib的使用方法示例
Nov 29 #Python
Python实现的选择排序算法示例
Nov 29 #Python
Python实现的桶排序算法示例
Nov 29 #Python
[原创]教女朋友学Python(一)运行环境搭建
Nov 29 #Python
对变量赋值的理解--Pyton中让两个值互换的实现方法
Nov 29 #Python
基于Python函数的作用域规则和闭包(详解)
Nov 29 #Python
You might like
PHP微信H5支付开发实例
2018/07/25 PHP
利用javascript实现一些常用软件的下载导航
2009/08/03 Javascript
JQuery 技巧和窍门整理(8个)
2010/04/22 Javascript
封装了一个js图片轮换效果的函数
2011/09/28 Javascript
jQuery的attr与prop使用介绍
2013/10/10 Javascript
JS控制图片等比例缩放的示例代码
2013/12/24 Javascript
浅谈JavaScript中Date(日期对象),Math对象
2015/02/05 Javascript
JavaSciprt中处理字符串之sup()方法的使用教程
2015/06/08 Javascript
超级给力的JavaScript的React框架入门教程
2015/07/02 Javascript
JavaScript实现横向滑出的多级菜单效果
2015/10/09 Javascript
javascript实现瀑布流加载图片原理
2016/02/02 Javascript
JS经典正则表达式笔试题汇总
2016/12/15 Javascript
Vue.js实现一个SPA登录页面的过程【推荐】
2017/04/29 Javascript
nodejs基础之buffer缓冲区用法分析
2018/12/26 NodeJs
axios+Vue实现上传文件显示进度功能
2019/04/14 Javascript
vue项目中js-cookie的使用存储token操作
2020/11/13 Javascript
[01:05:56]2018DOTA2亚洲邀请赛3月29日 小组赛A组 Newbee VS VG
2018/03/30 DOTA
[01:02:46]VGJ.S vs NB 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Linux下编译安装MySQL-Python教程
2015/02/02 Python
python 实现敏感词过滤的方法
2019/01/21 Python
python序列类型种类详解
2020/02/26 Python
python解包概念及实例
2021/02/17 Python
澳大利高级泳装品牌:Bondi Born
2018/05/23 全球购物
澳大利亚最受欢迎的美发用品目的地:AMR
2019/08/28 全球购物
如何通过jdbc调用存储过程
2012/04/19 面试题
运动会稿件50字
2014/02/17 职场文书
小小的船教学反思
2014/02/21 职场文书
《池塘边的叫声》教学反思
2014/04/12 职场文书
优秀教师演讲稿
2014/05/06 职场文书
大学生实习推荐信
2015/03/27 职场文书
2015暑假假期总结
2015/07/13 职场文书
环保建议书作文500字
2015/09/14 职场文书
创业计划书之甜品店
2019/09/18 职场文书
python plt.plot bar 如何设置绘图尺寸大小
2021/06/01 Python
MySQL 数据类型详情
2021/11/11 MySQL
Python selenium绕过webdriver监测执行javascript
2022/04/12 Python