python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Pandas 对Dataframe结构排序的实现方法
Apr 10 Python
详解django.contirb.auth-认证
Jul 16 Python
python代码过长的换行方法
Jul 19 Python
Pandas之ReIndex重新索引的实现
Jun 25 Python
python实现读取excel文件中所有sheet操作示例
Aug 09 Python
Python缓存技术实现过程详解
Sep 25 Python
浅析Django中关于session的使用
Dec 30 Python
pytorch nn.Conv2d()中的padding以及输出大小方式
Jan 10 Python
Python hashlib常见摘要算法详解
Jan 13 Python
Tensorflow中的图(tf.Graph)和会话(tf.Session)的实现
Apr 22 Python
Python如何爬取b站热门视频并导入Excel
Aug 10 Python
如何在向量化NumPy数组上进行移动窗口
May 18 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
使用adodb lite解决问题
2006/12/31 PHP
php include加载文件两种方式效率比较
2010/08/08 PHP
php foreach 参数强制类型转换的问题
2010/12/10 PHP
以文件形式缓存php变量的方法
2015/06/26 PHP
PHP中include和require的区别实例分析
2017/05/07 PHP
PHP实现类似题库抽题效果
2018/08/16 PHP
PHP For循环字母A-Z当超过26个字母时输出AA,AB,AC
2020/02/16 PHP
JavaScript 不只是脚本
2007/05/30 Javascript
jquery radio 操作代码
2011/03/16 Javascript
javascript开发技术大全 第4章 直接量与字符集
2011/07/03 Javascript
Javascript Memoizer浅析
2014/10/16 Javascript
js+html5通过canvas指定开始和结束点绘制线条的方法
2015/06/05 Javascript
js实现网站最上边可关闭的浮动广告条代码
2015/09/04 Javascript
通过Tabs方法基于easyUI+bootstrap制作工作站
2016/03/28 Javascript
jquery封装插件时匿名函数形参和实参的写法解释
2017/02/14 Javascript
js模拟百度模糊搜索的实例
2017/08/04 Javascript
JavaScript上传文件时不用刷新页面方法总结(推荐)
2017/08/15 Javascript
微信小程序删除处理详解
2017/08/16 Javascript
node实现定时发送邮件的示例代码
2017/08/26 Javascript
Angular中管道操作符(|)的使用方法
2017/12/15 Javascript
JavaScript fetch接口案例解析
2018/08/30 Javascript
基于Angularjs-router动态改变Title值的问题
2018/08/30 Javascript
element ui分页多选,翻页记忆的实例
2019/09/03 Javascript
微信小程序实现页面浮动导航
2020/01/08 Javascript
[52:00]2018DOTA2亚洲邀请赛 4.1 小组赛 A组加赛 LGD vs Optic
2018/04/02 DOTA
python3中利用filter函数输出小于某个数的所有回文数实例
2019/11/24 Python
Pandas —— resample()重采样和asfreq()频度转换方式
2020/02/26 Python
编写一子程序,将一链表倒序,即使链表表尾变表头,表头变表尾
2016/02/10 面试题
大学生职业生涯规划范文
2014/01/08 职场文书
竞赛口号大全
2014/06/16 职场文书
倡议书格式及范文
2015/04/29 职场文书
2015年信息宣传工作总结
2015/05/26 职场文书
企业团队精神心得体会
2016/01/19 职场文书
简历中的自我评价应该这样写!
2019/07/12 职场文书
SpringBoot集成Druid连接池连接MySQL8.0.11
2021/07/02 Java/Android
在Python 中将类对象序列化为JSON
2022/04/06 Python