python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中多线程的创建及基本调用方法
Jul 08 Python
mac下如何将python2.7改为python3
Jul 13 Python
python3+selenium实现qq邮箱登陆并发送邮件功能
Jan 23 Python
Python应用领域和就业形势分析总结
May 14 Python
python把转列表为集合的方法
Jun 28 Python
Python批量修改图片分辨率的实例代码
Jul 04 Python
Python实现打印实心和空心菱形
Nov 23 Python
Python常用模块sys,os,time,random功能与用法实例分析
Jan 07 Python
python logging设置level失败的解决方法
Feb 19 Python
Pytorch对Himmelblau函数的优化详解
Feb 29 Python
Python ADF 单位根检验 如何查看结果的实现
Jun 03 Python
10款最佳Python开发工具推荐,每一款都是神器
Oct 15 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
PHP详解ASCII码对照表与字符转换
2011/12/05 PHP
php实现水仙花数的4个示例分享
2014/04/08 PHP
PHP6连接SQLServer2005的三部曲
2016/04/15 PHP
php结合mysql与mysqli扩展处理事务的方法
2016/06/29 PHP
js cookies 常见网页木马挂马代码 24小时只加载一次
2009/04/13 Javascript
JavaScript replace(rgExp,fn)正则替换的用法
2010/03/04 Javascript
文字不间断滚动(上下左右)实例代码
2013/04/21 Javascript
Jquery 跨域访问 Lightswitch OData Service的方法
2013/09/11 Javascript
在javaScript中关于submit和button的区别介绍
2013/10/20 Javascript
jquery修改属性值实例代码(设置属性值)
2014/01/06 Javascript
Javascript 实现复制(Copy)动作方法大全
2014/06/20 Javascript
浅析JavaScript 调试方法和技巧
2015/10/22 Javascript
Vue不能检测到Object/Array更新的情况的解决
2018/06/26 Javascript
对vue 键盘回车事件的实例讲解
2018/08/25 Javascript
jQuery实现的模仿雨滴下落动画效果
2018/12/11 jQuery
vuejs+element UI table表格中实现禁用部分复选框的方法
2019/09/20 Javascript
mpvue微信小程序开发之实现一个弹幕评论
2019/11/24 Javascript
公众号SVG动画交互实战代码
2020/05/31 Javascript
[09:13]2014DOTA2国际邀请赛 中国区预选赛coser表演
2014/05/23 DOTA
Python中用函数作为返回值和实现闭包的教程
2015/04/27 Python
MySQL最常见的操作语句小结
2015/05/07 Python
浅谈Python Opencv中gamma变换的使用详解
2018/04/02 Python
pandas修改DataFrame列名的方法
2018/04/08 Python
Python定义二叉树及4种遍历方法实例详解
2018/07/05 Python
程序员的七夕用30行代码让Python化身表白神器
2019/08/07 Python
浅谈numpy中np.array()与np.asarray的区别以及.tolist
2020/06/03 Python
python 使用tkinter+you-get实现视频下载器
2020/11/17 Python
详解HTML5中表单验证的8种方法介绍
2016/12/19 HTML / CSS
C语言编程题
2015/03/09 面试题
计算机专业推荐信范文
2013/11/27 职场文书
英文求职信范文
2014/05/23 职场文书
2015应届毕业生求职信范文
2015/03/20 职场文书
趣味运动会通讯稿
2015/07/18 职场文书
交通事故责任认定书
2015/08/06 职场文书
Springboot配置suffix指定mvc视图的后缀方法
2021/07/03 Java/Android
js前端面试常见浏览器缓存强缓存及协商缓存实例
2022/06/21 Javascript