python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python和pyqt实现360的CLable控件
Feb 21 Python
在Python中使用异步Socket编程性能测试
Jun 25 Python
python中尾递归用法实例详解
Apr 28 Python
Python的自动化部署模块Fabric的安装及使用指南
Jan 19 Python
Python爬虫DNS解析缓存方法实例分析
Jun 02 Python
python实现简单的文字识别
Nov 27 Python
解析python的局部变量和全局变量
Aug 15 Python
Python GUI学习之登录系统界面篇
Aug 21 Python
Python3.9 beta2版本发布了,看看这7个新的PEP都是什么
Jun 10 Python
Idea安装python显示无SDK问题解决方案
Aug 12 Python
BeautifulSoup中find和find_all的使用详解
Dec 07 Python
用Python自动清理电脑内重复文件,只要10行代码(自动脚本)
Jan 09 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
destoon实现首页显示供应、企业、资讯条数的方法
2014/07/15 PHP
PHP基于数组实现的分页函数实例
2014/08/20 PHP
ThinkPHP自定义函数解决模板标签加减运算的方法
2015/07/03 PHP
php-fpm超时时间设置request_terminate_timeout资源问题分析
2019/09/27 PHP
Prototype使用指南之hash.js
2007/01/10 Javascript
5 cool javascript apps
2007/03/24 Javascript
ExtJS PropertyGrid中使用Combobox选择值问题
2010/06/13 Javascript
js对象之JS入门之Array对象操作小结
2011/01/09 Javascript
JavaScript高级程序设计(第3版)学习笔记10 再访js对象
2012/10/11 Javascript
由点击页面其它地方隐藏div所想到的jQuery的delegate
2013/08/29 Javascript
JavaScript模拟鼠标右键菜单效果
2020/12/08 Javascript
jQuery继承extend用法详解
2016/10/10 Javascript
BootStrap Datepicker 插件修改为默认中文的实现方法
2017/02/10 Javascript
深入理解在JS中通过四种设置事件处理程序的方法
2017/03/02 Javascript
AngularJs 禁止模板缓存的方法
2017/11/28 Javascript
vue2.0 移动端实现下拉刷新和上拉加载更多的示例
2018/04/23 Javascript
[38:32]完美世界DOTA2联赛循环赛 Forest vs DM 第二场 11.06
2020/11/06 DOTA
Python Selenium Cookie 绕过验证码实现登录示例代码
2018/04/10 Python
Tensorflow实现多GPU并行方式
2020/02/03 Python
Python调用JavaScript代码的方法
2020/10/27 Python
python实现无边框进度条的实例代码
2020/12/30 Python
Python关于拓扑排序知识点讲解
2021/01/04 Python
python 利用matplotlib在3D空间绘制二次抛物面的案例
2021/02/06 Python
美国办公用品折扣网站:Shoplet.com
2019/11/24 全球购物
vue项目实现分页效果
2021/03/24 Vue.js
工业学校毕业生自荐书
2014/01/03 职场文书
优秀信贷员先进事迹
2014/01/31 职场文书
酒店采购员岗位职责
2014/03/14 职场文书
五水共治一句话承诺
2014/05/30 职场文书
教师群众路线心得体会
2014/11/04 职场文书
2014年电厂工作总结
2014/12/04 职场文书
2015年幼儿园教研活动总结
2015/03/25 职场文书
2015年员工工作总结范文
2015/04/08 职场文书
创建文明城市倡议书
2015/04/28 职场文书
电工实训心得体会
2016/01/14 职场文书
2016应届大学生自荐信模板
2016/01/28 职场文书