Python爬虫框架Scrapy常用命令总结


Posted in Python onJuly 26, 2018

本文实例讲述了Python爬虫框架Scrapy常用命令。分享给大家供大家参考,具体如下:

在Scrapy中,工具命令分为两种,一种为全局命令,一种为项目命令

全局命令不需要依靠Scrapy项目就可以在全局中直接运行,而项目命令必须要在Scrapy项目中才可以运行

全局命令

全局命令有哪些呢,要想了解在Scrapy中有哪些全局命令,可以在不进入Scrapy项目所在目录的情况下,运行scrapy-h,如图所示:

Python爬虫框架Scrapy常用命令总结

可以看到,此时在可用命令在终端下展示出了常见的全局命令,分别为fetchrunspidersettingsshellstartprojectversionview

fetch命令

fetch命令主要用来显示爬虫爬取的过程.如下图所示:

Python爬虫框架Scrapy常用命令总结

在使用fetch命令时,同样可以使用某些参数进行相应的控制。那么fetch有哪些相关参数可以使用呢?我们可以通过scrpy fetch -h列出所有可以使用的fetch相关参数。比如我们可以使用?headers显示头信息,也可以使用?nolog控制不显示日志信息,还可以使用?spider=SPIDER参数来控制使用哪个爬虫,通过?logfile=FILE指定存储日志信息的文件,通过?loglevel=LEVEL控制日志等级。举个栗子:

# 显示头信息,并且不显示日志信息
scrpay -fetch --headers --nolog http://www.baidu.com

sunspider命令

通过runspider命令可以不依托scrapy的爬虫项目,直接运行一个爬虫文件

# first.py为自定义的一个爬虫文件
scrapy runspider first.py

settings命令

在scrapy项目所在的目录中使用settings命令查看的使用对应的项目配置信息,如果在scrapy项目所在的目录外使用settings命令查看的Scrapy默认的配置信息

# 在项目中使用此命令打印的为BOT_NAME对应的值,即scrapy项目名称。
# 在项目外使用此命令打印的为scrapybot
scrapy settings --get BOT_NAME

shell命令

通过shell命令可以启动Scrapy的交互终端。

Scrapy的交互终端经常在开发以及调试的时候用到,使用Scrapy的交互终端可以实现在不启动Scrapy爬虫的情况下,对网站响应进行调试,同样,在该交互终端下,我们也可以写一些Python代码进行相应测试。

Python爬虫框架Scrapy常用命令总结

>>>后面可以输入交互命令以及相应的代码

startproject命令

用于创建scrapy项目

version命令

查看scrapy版本

view命令

用于下载某个网页,然后通过浏览器查看

项目命令

bench命令

测试本地硬件的性能

scrapy bench

genspider命令

用于创建爬虫文件,这是一种快速创建爬虫文件的方式。

# scrpay genspider -t 基本格式
# basic 模板
# baidu.com 爬取的域名
scrapy genspider -t basic xxx baidu.com

此时在spider文件夹下会生成一个以xxx命名的py文件。可以使用scrapy genspider -l查看所有可用爬虫模板。当前可用的爬虫模板有:basiccrawlcsvfeedxmlfeed

check命令

使用check命令可以实现对某个爬虫文件进行合同检查,即测试.

# xxx为爬虫名
scrapy check xxx

crawl命令

启动某个爬虫

# xxx为爬虫名
scrapy crawl xxx

list命令

列出当前可使用的爬虫文件

scrapy list

edit命令

编辑爬虫文件

scrapy edit xxx

parse命令

通过parse命令,我们可以实现获取指定的URL网址,并使用对应的爬虫文件进行处理和分析

日志等级

等级名 含义
CRITICAL 发生了最严重的错误
ERROR 发生了必须立即处理的错误
WARNING 出现了一些警告信息,即存在潜在错误
INFO 输出一些提示显示
DEBUG 输出一些调试信息

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python使用心得之获得github代码库列表
Jun 25 Python
在Python中使用pngquant压缩png图片的教程
Apr 09 Python
Python基于生成器迭代实现的八皇后问题示例
May 23 Python
pandas.DataFrame选取/排除特定行的方法
Jul 03 Python
python 3.7.0 下pillow安装方法
Aug 27 Python
Python面向对象总结及类与正则表达式详解
Apr 18 Python
详解pandas如何去掉、过滤数据集中的某些值或者某些行?
May 15 Python
python实现函数极小值
Jul 10 Python
Python对接 xray 和微信实现自动告警
Sep 17 Python
Pycharm 字体大小调整设置的方法实现
Sep 27 Python
pandas中read_csv、rolling、expanding用法详解
Apr 21 Python
Python实现加密的RAR文件解压的方法(密码已知)
Sep 11 Python
Python退火算法在高次方程的应用
Jul 26 #Python
Python爬虫框架Scrapy基本用法入门教程
Jul 26 #Python
Tensorflow 合并通道及加载子模型的方法
Jul 26 #Python
解决tensorflow测试模型时NotFoundError错误的问题
Jul 26 #Python
tensorflow 恢复指定层与不同层指定不同学习率的方法
Jul 26 #Python
kaggle+mnist实现手写字体识别
Jul 26 #Python
解决tensorflow模型参数保存和加载的问题
Jul 26 #Python
You might like
php实现购物车功能(上)
2020/07/23 PHP
PHP上传图片、删除图片简单实例
2016/11/12 PHP
PHP PDO数据库操作预处理与注意事项
2019/03/16 PHP
PHP 面向对象程序设计之类属性与类常量实现方法分析
2020/04/13 PHP
js计算页面刷新的次数
2009/07/20 Javascript
javascript Demo模态窗口
2009/12/06 Javascript
Extjs学习笔记之一 初识Extjs之MessageBox
2010/01/07 Javascript
复制Input内容的js代码_支持所有浏览器,修正了Firefox3.5以上的问题
2010/06/21 Javascript
extjs之去除s.gif的影响
2010/12/25 Javascript
JS.getTextContent(element,preformatted)使用介绍
2013/09/21 Javascript
自己用jQuery写了一个图片的马赛克消失效果
2014/05/04 Javascript
微信小程序 动态传参实例详解
2017/04/27 Javascript
实现微信小程序的wxml文件和wxss文件在webstrom的支持
2017/06/12 Javascript
通过原生vue添加滚动加载更多功能
2019/11/21 Javascript
如何基于layui的laytpl实现数据绑定的示例代码
2020/04/10 Javascript
vue动态加载SVG文件并修改节点数据的操作代码
2020/08/17 Javascript
[07:48]DOTA2上海特级锦标赛主赛事首日RECAP
2016/03/04 DOTA
关于python下cv.waitKey无响应的原因及解决方法
2019/01/10 Python
我用Python抓取了7000 多本电子书案例详解
2019/03/25 Python
django创建超级用户时指定添加其它字段方式
2020/05/14 Python
Python绘制动态水球图过程详解
2020/06/03 Python
如何基于pandas读取csv后合并两个股票
2020/09/25 Python
CSS书写规范、顺序和命名规则
2014/03/06 HTML / CSS
使用CSS3来实现滚动视差效果的教程
2015/08/24 HTML / CSS
程序设计HTML5 Canvas API
2013/04/08 HTML / CSS
美国著名的婴儿学步鞋老品牌:Robeez
2016/08/20 全球购物
加拿大高尔夫超市:Golf Town
2018/01/12 全球购物
三星英国官网:Samsung英国
2018/09/25 全球购物
网络教育自我鉴定
2014/02/04 职场文书
文明风采获奖感言
2014/02/18 职场文书
保险内勤岗位职责
2014/04/05 职场文书
招标授权委托书样本
2014/09/23 职场文书
试用期辞职信范文
2015/03/02 职场文书
2016年小学生教师节广播稿
2015/12/18 职场文书
2019年关于小学生课外阅读情况的分析报告
2019/12/02 职场文书
浅析Python中的随机采样和概率分布
2021/12/06 Python