编程 Python

python scrapy重复执行实现代码详解

Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，我们只需要实现少量的代码，就能够快速的抓取

Scrapy模块：

1、scheduler:用来存放url队列

2、downloader：发送请求

3、spiders:提取数据和url

4、itemPipeline：数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python scrapy重复执行实现代码详解

- Author -

winstonsias

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Pandas 对Dataframe结构排序的实现方法

Apr 10 Python

详解django.contirb.auth-认证

Jul 16 Python

python代码过长的换行方法

Jul 19 Python

Pandas之ReIndex重新索引的实现

Jun 25 Python

python实现读取excel文件中所有sheet操作示例

Aug 09 Python

Python缓存技术实现过程详解

Sep 25 Python

浅析Django中关于session的使用

Dec 30 Python

pytorch nn.Conv2d()中的padding以及输出大小方式

Jan 10 Python

Python hashlib常见摘要算法详解

Jan 13 Python

Tensorflow中的图（tf.Graph）和会话（tf.Session）的实现

Apr 22 Python

Python如何爬取b站热门视频并导入Excel

Aug 10 Python

如何在向量化NumPy数组上进行移动窗口

May 18 Python

Python统计时间内的并发数代码实例

Dec 28 #Python

如何基于python实现脚本加密

Dec 28 #Python

python使用配置文件过程详解

Dec 28 #Python

python正则表达式匹配IP代码实例

Dec 28 #Python

python爬虫模拟浏览器访问-User-Agent过程解析

Dec 28 #Python

python爬虫添加请求头代码实例

Dec 28 #Python

python使用rsa非对称加密过程解析

Dec 28 #Python

You might like

使用adodb lite解决问题

2006/12/31 PHP

php include加载文件两种方式效率比较

2010/08/08 PHP

php foreach 参数强制类型转换的问题

2010/12/10 PHP

以文件形式缓存php变量的方法

2015/06/26 PHP

PHP中include和require的区别实例分析

2017/05/07 PHP

PHP实现类似题库抽题效果

2018/08/16 PHP

PHP For循环字母A-Z当超过26个字母时输出AA,AB,AC

2020/02/16 PHP

JavaScript 不只是脚本

2007/05/30 Javascript

jquery radio 操作代码

2011/03/16 Javascript

javascript开发技术大全第4章直接量与字符集

2011/07/03 Javascript

Javascript Memoizer浅析

2014/10/16 Javascript

js+html5通过canvas指定开始和结束点绘制线条的方法

2015/06/05 Javascript

js实现网站最上边可关闭的浮动广告条代码

2015/09/04 Javascript

通过Tabs方法基于easyUI+bootstrap制作工作站

2016/03/28 Javascript

jquery封装插件时匿名函数形参和实参的写法解释

2017/02/14 Javascript

js模拟百度模糊搜索的实例

2017/08/04 Javascript

JavaScript上传文件时不用刷新页面方法总结（推荐）

2017/08/15 Javascript

微信小程序删除处理详解

2017/08/16 Javascript

node实现定时发送邮件的示例代码

2017/08/26 Javascript

Angular中管道操作符(|)的使用方法

2017/12/15 Javascript

JavaScript fetch接口案例解析

2018/08/30 Javascript

基于Angularjs-router动态改变Title值的问题

2018/08/30 Javascript

element ui分页多选,翻页记忆的实例

2019/09/03 Javascript

微信小程序实现页面浮动导航

2020/01/08 Javascript

[52:00]2018DOTA2亚洲邀请赛 4.1 小组赛 A组加赛 LGD vs Optic

2018/04/02 DOTA

python3中利用filter函数输出小于某个数的所有回文数实例

2019/11/24 Python

Pandas —— resample()重采样和asfreq()频度转换方式

2020/02/26 Python

编写一子程序，将一链表倒序，即使链表表尾变表头，表头变表尾

2016/02/10 面试题

大学生职业生涯规划范文

2014/01/08 职场文书

竞赛口号大全

2014/06/16 职场文书

倡议书格式及范文

2015/04/29 职场文书

2015年信息宣传工作总结

2015/05/26 职场文书

企业团队精神心得体会

2016/01/19 职场文书

简历中的自我评价应该这样写！

2019/07/12 职场文书

SpringBoot集成Druid连接池连接MySQL8.0.11

2021/07/02 Java/Android

在Python 中将类对象序列化为JSON

2022/04/06 Python