pycharm下打开、执行并调试scrapy爬虫程序的方法


Posted in Python onNovember 29, 2017

首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1

pycharm下打开、执行并调试scrapy爬虫程序的方法

目录结构如下:

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开Pycharm,选择open

pycharm下打开、执行并调试scrapy爬虫程序的方法

选择项目,ok

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开如下界面之后,按alt + 1, 打开project 面板

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1/spiders/,文件夹下,新建一个爬虫spider.py, 注意代码中的name="dmoz"。这个名字后面会用到。

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1目录和scrapy.cfg同级目录下面,新建一个begin.py文件(便于理解可以写成main.py),注意箭头2所指的名字和第5步中的name='dmoz'名字是一样的。

from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())

pycharm下打开、执行并调试scrapy爬虫程序的方法

7. 上面把文件搞定了,下面要配置一下pycharm了。点击Run->Edit Configurations

pycharm下打开、执行并调试scrapy爬虫程序的方法

8. 新建一个运行的python模块

pycharm下打开、执行并调试scrapy爬虫程序的方法

9. Name:改成spider; script:选择刚才新建的那个begin.py文件;Working Direciton:改成自己的工作目录

pycharm下打开、执行并调试scrapy爬虫程序的方法

10. 至此,大功告成了,点击下图,右上角的按钮就能运行了。

pycharm下打开、执行并调试scrapy爬虫程序的方法

调试

可以在其他代码中设置断点,就可以debug运行

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

遇到问题

1. Unknown command: crawl

调试运行,断点并未命中,控制台输出信息如下:

H:\Python\Python36\python.exe "H:\Program Files (x86)\JetBrains\PyCharm Community Edition 4.5.4\helpers\pydev\pydevd.py" --multiproc --client 127.0.0.1 --port 59810 --file H:/Python/Python36/Lib/site-packages/scrapy/cmdline.py crawl quotes -o quotes.jl
pydev debugger: process 4740 is connecting

Connected to pydev debugger (build 141.3058)
Scrapy 1.3.2 - no active project

Unknown command: crawl

Use "scrapy" to see available commands

Process finished with exit code 2

工作目录设置有误,造成无法识别 scrapy 命令,按照上文所说,将工作目录设置为包含 scrapy.cfg,重新运行,问题解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3 实现的人人影视网站自动签到
Jun 19 Python
python多进程和多线程究竟谁更快(详解)
May 29 Python
python对离散变量的one-hot编码方法
Jul 11 Python
PyCharm+PySpark远程调试的环境配置的方法
Nov 29 Python
python装饰器常见使用方法分析
Jun 26 Python
python单例设计模式实现解析
Jan 07 Python
Scrapy框架基本命令与settings.py设置
Feb 06 Python
利用Python脚本批量生成SQL语句
Mar 04 Python
2020最新pycharm汉化安装(python工程狮亲测有效)
Apr 26 Python
Python 跨.py文件调用自定义函数说明
Jun 01 Python
Python进行统计建模
Aug 10 Python
python通过新建环境安装tfx的问题
May 20 Python
Python快速排序算法实例分析
Nov 29 #Python
Python3学习urllib的使用方法示例
Nov 29 #Python
Python实现的选择排序算法示例
Nov 29 #Python
Python实现的桶排序算法示例
Nov 29 #Python
[原创]教女朋友学Python(一)运行环境搭建
Nov 29 #Python
对变量赋值的理解--Pyton中让两个值互换的实现方法
Nov 29 #Python
基于Python函数的作用域规则和闭包(详解)
Nov 29 #Python
You might like
php 用sock技术发送邮件的函数
2007/07/21 PHP
php session应用实例 登录验证
2009/03/16 PHP
smarty内置函数section的用法
2015/01/22 PHP
php实现对象克隆的方法
2015/06/20 PHP
Nginx实现反向代理
2017/09/20 Servers
thinkphp中U方法按路由规则生成url的方法
2018/03/12 PHP
imagettftext() 失效,不起作用
2021/03/09 PHP
jquery isEmptyObject判断是否为空对象的函数
2011/02/14 Javascript
jQuery1.9.1针对checkbox的调整方法(prop)
2014/05/01 Javascript
使用jQuery的attr方法来修改onclick值
2014/07/07 Javascript
js判断是否按下了Shift键的方法
2015/01/27 Javascript
Javascript如何判断数据类型和数组类型
2016/06/22 Javascript
react-native DatePicker日期选择组件的实现代码
2017/09/12 Javascript
通过一个简单的例子学会vuex与模块化
2017/11/22 Javascript
详解webpack打包时排除其中一个css、js文件或单独打包一个css、js文件(两种方法)
2018/10/26 Javascript
webpack中如何加载静态文件的方法步骤
2019/05/18 Javascript
vue3.0 搭建项目总结(详细步骤)
2019/05/20 Javascript
详解使用WebPack搭建React开发环境
2019/08/06 Javascript
python分割文件的常用方法
2014/11/01 Python
python获取文件扩展名的方法
2015/07/06 Python
Python中的错误和异常处理简单操作示例【try-except用法】
2017/07/25 Python
Python 保持登录状态进行接口测试的方法示例
2019/08/06 Python
python中matplotlib条件背景颜色的实现
2019/09/02 Python
pymysql 开启调试模式的实现
2019/09/24 Python
python 图片二值化处理(处理后为纯黑白的图片)
2019/11/01 Python
Django 自定义404 500等错误页面的实现
2020/03/08 Python
Django-celery-beat动态添加周期性任务实现过程解析
2020/11/26 Python
Ted Baker英国官网:男士和女士服装及配件
2017/03/13 全球购物
韩都衣舍天猫官方旗舰店:天猫女装销售总冠军
2017/10/10 全球购物
物业管理计划书
2014/01/10 职场文书
机关道德讲堂实施方案
2014/03/15 职场文书
实习生评语
2014/04/26 职场文书
2015小学教师年度工作总结
2015/05/12 职场文书
2015年生活老师工作总结
2015/05/27 职场文书
读《解忧杂货店》有感:请相信一切都是最好的安排
2019/11/07 职场文书
详解Spring Security如何在权限中使用通配符
2022/06/28 Java/Android