python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中处理字符串之islower()方法的使用简介
May 19 Python
使用Python对Excel进行读写操作
Mar 30 Python
详解python执行shell脚本创建用户及相关操作
Apr 11 Python
详解利用Python scipy.signal.filtfilt() 实现信号滤波
Jun 05 Python
Python Subprocess模块原理及实例
Aug 26 Python
django自带调试服务器的使用详解
Aug 29 Python
如何使用repr调试python程序
Feb 28 Python
为什么相对PHP黑python的更少
Jun 21 Python
浅谈sklearn中predict与predict_proba区别
Jun 28 Python
Python爬虫进阶之爬取某视频并下载的实现
Dec 08 Python
python Timer 类使用介绍
Dec 28 Python
Python数据分析入门之数据读取与存储
May 13 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
php后台多用户权限组思路与实现程序代码分享
2012/02/13 PHP
php 获取SWF动画截图示例代码
2014/02/10 PHP
php数组分页实现方法
2016/04/30 PHP
php脚本守护进程原理与实现方法详解
2017/07/20 PHP
TP5框架model常见操作示例小结【增删改查、聚合、时间戳、软删除等】
2020/04/05 PHP
javascript 操作文件 实现方法小结
2009/07/02 Javascript
讨论javascript(一)工厂方式 js面象对象的定义方法
2009/12/15 Javascript
两个比较有用的Javascript工具函数代码
2010/02/17 Javascript
js 火狐下取本地路径实现思路
2013/04/02 Javascript
基于js disabled="false"不起作用的解决办法
2013/06/26 Javascript
Jquery:ajax实现翻页无刷新功能代码
2013/08/05 Javascript
再谈Jquery Ajax方法传递到action(补充)
2014/05/12 Javascript
js事件监听机制(事件捕获)总结
2014/08/08 Javascript
js实现密码强度检测【附示例】
2016/03/30 Javascript
仿iframe效果Aajx文件上传实例
2016/11/18 Javascript
又一款MVVM组件 构建自己的Vue组件(2)
2017/03/13 Javascript
jquery插件开发之选项卡制作详解
2017/08/30 jQuery
vue使用axios上传文件(FormData)的方法
2019/04/14 Javascript
[00:32]2018DOTA2亚洲邀请赛Secret出场
2018/04/03 DOTA
python模块restful使用方法实例
2013/12/10 Python
python使用Tkinter显示网络图片的方法
2015/04/24 Python
python创建临时文件夹的方法
2015/07/06 Python
Python排序搜索基本算法之冒泡排序实例分析
2017/12/09 Python
python多线程实现代码(模拟银行服务操作流程)
2020/01/13 Python
Ratchet 模态框的实现
2020/08/19 HTML / CSS
北美三大旅游网站之一:Travelocity加拿大
2016/08/20 全球购物
在Ajax应用中信息是如何在浏览器和服务器之间传递的
2016/05/31 面试题
医科大学生毕业的自我评价分享
2013/11/12 职场文书
2014镇副书记群众路线专题民主生活会思想汇报
2014/09/23 职场文书
县长群众路线对照检查材料思想汇报
2014/10/02 职场文书
学生会感恩节活动方案
2014/10/11 职场文书
综治工作汇报材料
2014/10/27 职场文书
毕业实习指导教师评语
2014/12/31 职场文书
三好学生主要事迹材料
2015/11/03 职场文书
年终工作总结范文
2019/06/20 职场文书
JavaScript实现一键复制内容剪贴板
2022/07/23 Javascript