基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
phpsir 开发 一个检测百度关键字网站排名的python 程序
Sep 17 Python
python模块restful使用方法实例
Dec 10 Python
Python实现解析Bit Torrent种子文件内容的方法
Aug 29 Python
Python输出各行命令详解
Feb 01 Python
python实现抖音点赞功能
Apr 07 Python
Django组件cookie与session的具体使用
Jun 05 Python
PyQt5实现让QScrollArea支持鼠标拖动的操作方法
Jun 19 Python
pyenv与virtualenv安装实现python多版本多项目管理
Aug 17 Python
使用Python实现分别输出每个数组
Dec 06 Python
Python使用py2neo操作图数据库neo4j的方法详解
Jan 13 Python
Python使用monkey.patch_all()解决协程阻塞问题
Apr 15 Python
python批量检查两个对应的txt文件的行数是否一致的实例代码
Oct 31 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
如何将数据从文本导入到mysql
2006/10/09 PHP
运用Windows XP附带的Msicuu.exe、Msizap.exe来彻底卸载顽固程序
2007/04/21 Javascript
求数组最大最小值方法适用于任何数组
2013/08/16 Javascript
javascript轻松实现当鼠标移开时已弹出子菜单自动消失
2013/12/29 Javascript
Javascript玩转继承(三)
2014/05/08 Javascript
jquery利用命名空间移除绑定事件的方法
2015/03/11 Javascript
JavaScript中获取纯正的undefined的方法
2016/03/06 Javascript
JS常用知识点整理
2017/01/21 Javascript
angularJs使用$watch和$filter过滤器制作搜索筛选实例
2017/06/01 Javascript
用vue-cli开发vue时的代理设置方法
2018/09/20 Javascript
jquery.pager.js分页实现详解
2019/07/29 jQuery
node.js中 redis 的安装和基本操作示例
2020/02/10 Javascript
使用next.js开发网址缩短服务的方法
2020/06/17 Javascript
vue组件入门知识全梳理
2020/09/21 Javascript
基于Vue+Webpack拆分路由文件实现管理
2020/11/16 Javascript
微信小程序自定义底部弹出框功能
2020/11/18 Javascript
[00:32]DOTA2上海特级锦标赛 COL战队宣传片
2016/03/04 DOTA
python正则表达式去掉数字中的逗号(python正则匹配逗号)
2013/12/25 Python
Python中最大最小赋值小技巧(分享)
2017/12/23 Python
python3 property装饰器实现原理与用法示例
2019/05/15 Python
django框架事务处理小结【ORM 事务及raw sql,customize sql 事务处理】
2019/06/27 Python
解决Django一个表单对应多个按钮的问题
2019/07/18 Python
Python通过VGG16模型实现图像风格转换操作详解
2020/01/16 Python
python画图常规设置方式
2020/03/05 Python
Python unittest框架操作实例解析
2020/04/13 Python
魔声耳机官方网站:Monster是世界第一品牌的高性能耳机
2016/10/26 全球购物
Sephora丝芙兰澳洲官方网站:国际知名化妆品购物
2016/10/27 全球购物
adidas泰国官网:adidas TH
2020/07/11 全球购物
将"引用"作为函数返回值类型的格式、好处和需要遵守的规则
2016/02/09 面试题
一套软件开发工程师笔试题
2015/05/18 面试题
企业军训感言
2014/02/08 职场文书
不打扫卫生检讨书
2014/02/12 职场文书
声乐专业大学生职业生涯规划书:理想的未来需要自己去打造
2014/09/20 职场文书
追悼词范文大全
2015/06/23 职场文书
教你用python实现一个无界面的小型图书管理系统
2021/05/21 Python
使用Redis实现点赞取消点赞的详细代码
2022/03/20 Redis