基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的作用域规则详解
Jan 30 Python
Python标准库defaultdict模块使用示例
Apr 28 Python
python3中str(字符串)的使用教程
Mar 23 Python
pycharm安装图文教程
May 02 Python
Python tkinter实现的图片移动碰撞动画效果【附源码下载】
Jan 04 Python
python制作mysql数据迁移脚本
Jan 01 Python
解决python字典对值(值为列表)赋值出现重复的问题
Jan 20 Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 Python
Python使用指定字符长度切分数据示例
Dec 05 Python
pycharm 实现本地写代码,服务器运行的操作
Jun 08 Python
Django中的DateTimeField和DateField实现
Feb 24 Python
Python Pandas常用函数方法总结
Jun 15 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
PHP简洁函数(PHP简单明了函数语法)
2012/06/10 PHP
浅析PHP Socket技术
2013/08/02 PHP
关于php微信订阅号开发之token验证后自动发送消息给订阅号但是没有消息返回的问题
2015/12/21 PHP
yii2项目实战之restful api授权验证详解
2017/05/20 PHP
实例讲解PHP表单
2020/06/10 PHP
基于jQuery全屏焦点图左右切换插件responsiveslides
2015/09/07 Javascript
谈谈javascript中使用连等赋值操作带来的问题
2015/11/26 Javascript
jQuery动态增减行的实例代码解析(推荐)
2016/12/05 Javascript
深入了解JavaScript的逻辑运算符(与、或)
2016/12/20 Javascript
javascript数组去重常用方法实例分析
2017/04/11 Javascript
ReactNative 之FlatList使用及踩坑封装总结
2017/11/29 Javascript
Javascript实现运算符重载详解
2018/04/07 Javascript
浅谈vux之x-input使用以及源码解读
2018/11/04 Javascript
Python牛刀小试密码爆破
2011/02/03 Python
Python实现国外赌场热门游戏Craps(双骰子)
2015/03/31 Python
详解python实现线程安全的单例模式
2018/03/05 Python
用pycharm开发django项目示例代码
2019/06/13 Python
python中break、continue 、exit() 、pass终止循环的区别详解
2019/07/08 Python
Python 私有化操作实例分析
2019/11/21 Python
css3学习心得分享
2013/08/19 HTML / CSS
HTML5+CSS3实例 :canvas 模拟实现电子彩票刮刮乐代码
2016/12/30 HTML / CSS
利用canvas实现图片压缩的示例代码
2018/07/17 HTML / CSS
Ado与Ado.net的相同与不同
2014/12/08 面试题
WEB控件及HTML服务端控件能否调用客户端方法?如果能,请解释如何调用?
2015/08/25 面试题
Java基础知识面试题
2014/03/25 面试题
人力资源管理专业应届生求职信
2013/09/28 职场文书
村捐赠仪式答谢词
2014/01/21 职场文书
犯错检讨书
2014/02/21 职场文书
学习保证书范文
2014/04/30 职场文书
专科应届毕业生求职信
2014/06/04 职场文书
低碳环保标语
2014/06/12 职场文书
高中国旗下的演讲稿
2014/08/28 职场文书
村主任“四风”问题个人整改措施
2014/10/04 职场文书
清洁员岗位职责
2015/02/15 职场文书
2016年政治理论学习心得体会
2016/01/25 职场文书
优化Mysql查询的示例
2022/04/26 MySQL