编程 Python

基于scrapy的redis安装和配置方法

Posted in Python onJune 13, 2018

在定向爬虫的制作过程中，使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库，它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

基于scrapy的redis安装和配置方法

- Author -

成吉思潇

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Linux下为不同版本python安装第三方库

Aug 31 Python

python3使用PyMysql连接mysql数据库实例

Feb 07 Python

django 2.0更新的10条注意事项总结

Jan 05 Python

Python编程实现的简单神经网络算法示例

Jan 26 Python

使用python的pandas库读取csv文件保存至mysql数据库

Aug 20 Python

python使用webdriver爬取微信公众号

Aug 31 Python

Python字符串逆序输出的实例讲解

Feb 16 Python

Python使用crontab模块设置和清除定时任务操作详解

Apr 09 Python

Python 中list ,set,dict的大规模查找效率对比详解

Oct 11 Python

python 装饰器功能与用法案例详解

Mar 06 Python

python如何使用代码运行助手

Jul 03 Python

python中的装饰器该如何使用

Jun 18 Python

mac下给python3安装requests库和scrapy库的实例

Jun 13 #Python

Python3实现将本地JSON大数据文件写入MySQL数据库的方法

Jun 13 #Python

解决Mac安装scrapy失败的问题

Jun 13 #Python

mac安装scrapy并创建项目的实例讲解

Jun 13 #Python

解决Tensorflow安装成功,但在导入时报错的问题

Jun 13 #Python

基于pip install django失败时的解决方法

Jun 12 #Python

基于Python pip用国内镜像下载的方法

Jun 12 #Python

You might like

用Zend Encode编写开发PHP程序

2010/02/21 PHP

ThinkPHP框架安全实现分析

2016/03/14 PHP

深入解析Laravel5.5中的包自动发现Package Auto Discovery

2017/09/13 PHP

php多进程并发编程防止出现僵尸进程的方法分析

2020/02/28 PHP

用jquery ajax获取网站Alexa排名的代码

2009/12/12 Javascript

jquery调用asp.net 页面后台的实现代码

2011/04/27 Javascript

jquery得到iframe src属性值的方法

2014/09/25 Javascript

浅谈javascript 归并方法

2015/01/21 Javascript

jQuery使用before()和after()在元素前后添加内容的方法

2015/03/26 Javascript

Jquery树插件zTree实现菜单树

2017/01/24 Javascript

JS实现加载和读取XML文件的方法详解

2017/04/24 Javascript

Redux 和 Mobx的选择问题：让你不再困惑！

2017/09/18 Javascript

详解项目升级到vue-cli3的正确姿势

2019/01/28 Javascript

JavaScript遍历数组的三种方法map、forEach与filter实例详解

2019/02/27 Javascript

vue表单验证你真的会了吗？vue表单验证（form）validate

2019/04/07 Javascript

vue项目创建并引入饿了么elementUI组件的步骤

2019/04/11 Javascript

ES10的13个新特性示例(小结)

2019/09/23 Javascript

JS函数进阶之继承用法实例分析

2020/01/15 Javascript

前端深入理解Typescript泛型概念

2020/03/09 Javascript

JavaScript编码小技巧分享

2020/09/17 Javascript

js实现扫雷源代码

2020/11/27 Javascript

python类参数self使用示例

2014/02/17 Python

Python列表append和+的区别浅析

2015/02/02 Python

python numpy和list查询其中某个数的个数及定位方法

2018/06/27 Python

Marmot土拨鼠官网：美国专业户外运动品牌

2018/01/11 全球购物

莫斯科制造商的廉价皮大衣：Fursk

2020/06/09 全球购物

仓库理货员岗位职责

2013/12/18 职场文书

优秀毕业生自我鉴定

2014/01/19 职场文书

小松树教学反思

2014/02/11 职场文书

会计人员演讲稿

2014/09/11 职场文书

2014离婚协议书范文两篇

2014/09/15 职场文书

介绍信的写法

2015/01/31 职场文书

开展警示教育活动总结

2015/05/09 职场文书

浪漫的婚礼主持词

2015/06/30 职场文书

终止合同协议书范本

2016/03/22 职场文书

在Docker容器中部署SQL Server

2022/04/11 Servers