基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Linux下为不同版本python安装第三方库
Aug 31 Python
python3使用PyMysql连接mysql数据库实例
Feb 07 Python
django 2.0更新的10条注意事项总结
Jan 05 Python
Python编程实现的简单神经网络算法示例
Jan 26 Python
使用python的pandas库读取csv文件保存至mysql数据库
Aug 20 Python
python使用webdriver爬取微信公众号
Aug 31 Python
Python字符串逆序输出的实例讲解
Feb 16 Python
Python使用crontab模块设置和清除定时任务操作详解
Apr 09 Python
Python 中list ,set,dict的大规模查找效率对比详解
Oct 11 Python
python 装饰器功能与用法案例详解
Mar 06 Python
python如何使用代码运行助手
Jul 03 Python
python中的装饰器该如何使用
Jun 18 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
用Zend Encode编写开发PHP程序
2010/02/21 PHP
ThinkPHP框架安全实现分析
2016/03/14 PHP
深入解析Laravel5.5中的包自动发现Package Auto Discovery
2017/09/13 PHP
php多进程并发编程防止出现僵尸进程的方法分析
2020/02/28 PHP
用jquery ajax获取网站Alexa排名的代码
2009/12/12 Javascript
jquery调用asp.net 页面后台的实现代码
2011/04/27 Javascript
jquery得到iframe src属性值的方法
2014/09/25 Javascript
浅谈javascript 归并方法
2015/01/21 Javascript
jQuery使用before()和after()在元素前后添加内容的方法
2015/03/26 Javascript
Jquery树插件zTree实现菜单树
2017/01/24 Javascript
JS实现加载和读取XML文件的方法详解
2017/04/24 Javascript
Redux 和 Mobx的选择问题:让你不再困惑!
2017/09/18 Javascript
详解项目升级到vue-cli3的正确姿势
2019/01/28 Javascript
JavaScript遍历数组的三种方法map、forEach与filter实例详解
2019/02/27 Javascript
vue表单验证你真的会了吗?vue表单验证(form)validate
2019/04/07 Javascript
vue项目创建并引入饿了么elementUI组件的步骤
2019/04/11 Javascript
ES10的13个新特性示例(小结)
2019/09/23 Javascript
JS函数进阶之继承用法实例分析
2020/01/15 Javascript
前端深入理解Typescript泛型概念
2020/03/09 Javascript
JavaScript编码小技巧分享
2020/09/17 Javascript
js实现扫雷源代码
2020/11/27 Javascript
python类参数self使用示例
2014/02/17 Python
Python列表append和+的区别浅析
2015/02/02 Python
python numpy和list查询其中某个数的个数及定位方法
2018/06/27 Python
Marmot土拨鼠官网:美国专业户外运动品牌
2018/01/11 全球购物
莫斯科制造商的廉价皮大衣:Fursk
2020/06/09 全球购物
仓库理货员岗位职责
2013/12/18 职场文书
优秀毕业生自我鉴定
2014/01/19 职场文书
小松树教学反思
2014/02/11 职场文书
会计人员演讲稿
2014/09/11 职场文书
2014离婚协议书范文两篇
2014/09/15 职场文书
介绍信的写法
2015/01/31 职场文书
开展警示教育活动总结
2015/05/09 职场文书
浪漫的婚礼主持词
2015/06/30 职场文书
终止合同协议书范本
2016/03/22 职场文书
在Docker容器中部署SQL Server
2022/04/11 Servers