基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python获取文件ssdeep值的方法
Oct 05 Python
python实现聚类算法原理
Feb 12 Python
python顺序的读取文件夹下名称有序的文件方法
Jul 11 Python
解决python3 urllib 链接中有中文的问题
Jul 16 Python
transform python环境快速配置方法
Sep 27 Python
Python实现深度遍历和广度遍历的方法
Jan 22 Python
Python实现点阵字体读取与转换的方法
Jan 29 Python
python安装requests库的实例代码
Jun 25 Python
在tensorflow中设置使用某一块GPU、多GPU、CPU的操作
Feb 07 Python
python实现logistic分类算法代码
Feb 28 Python
Python 实现RSA加解密文本文件
Dec 30 Python
pip install命令安装扩展库整理
Mar 02 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
PHP架构及原理知识点详解
2019/12/22 PHP
用于table内容排序
2006/07/21 Javascript
cnblogs csdn 代码运行框实现代码
2009/11/02 Javascript
JavaScript toFixed() 方法
2010/04/15 Javascript
JS获得浏览器版本和操作系统版本的例子
2014/05/13 Javascript
JS实现可调整倒计时间代码分享
2015/08/18 Javascript
jQuery实现发送验证码并60秒倒计时功能
2016/11/25 Javascript
vue双向数据绑定原理探究(附demo)
2017/01/17 Javascript
jQuery通过改变input的type属性实现密码显示隐藏切换功能
2017/02/08 Javascript
js 图片转base64的方式(两种)
2018/04/24 Javascript
vue+elementUi图片上传组件使用详解
2019/08/20 Javascript
在Vuex中Mutations修改状态操作
2020/07/24 Javascript
编写v-for循环的技巧汇总
2020/12/01 Javascript
Python的print用法示例
2014/02/11 Python
使用Python操作excel文件的实例代码
2017/10/15 Python
python里使用正则表达式的组嵌套实例详解
2017/10/24 Python
python 通过字符串调用对象属性或方法的实例讲解
2018/04/21 Python
python儿童学游戏编程知识点总结
2019/06/03 Python
淘宝秒杀python脚本 扫码登录版
2019/09/19 Python
关于TensorFlow新旧版本函数接口变化详解
2020/02/10 Python
python tqdm库的使用
2020/11/30 Python
CSS3 仿微信聊天小气泡实例代码
2017/04/05 HTML / CSS
H5 canvas中width、height和style的宽高区别详解
2018/11/02 HTML / CSS
英国电器零售商:PRC Direct
2018/06/21 全球购物
Lululemon加拿大官网:加拿大知名体育服装零售商
2019/04/12 全球购物
中国京东和泰国中央集团合资的网站:JD CENTRAL
2020/08/22 全球购物
硕士研究生自我鉴定
2013/11/08 职场文书
校园之星获奖感言
2014/01/29 职场文书
残疾人创业典型事迹
2014/02/01 职场文书
2014年健康教育实施方案
2014/02/17 职场文书
党委班子对照检查材料
2014/08/19 职场文书
2014第二批党的群众路线教育实践活动对照检查材料思想汇报
2014/09/18 职场文书
民间借贷协议书范本
2014/10/01 职场文书
绵山导游词
2015/02/05 职场文书
React如何创建组件
2021/06/27 Javascript
关于CentOS 8 搭建MongoDB4.4分片集群的问题
2021/10/24 MongoDB