python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python升级提示Tkinter模块找不到的解决方法
Aug 22 Python
Python中urllib2模块的8个使用细节分享
Jan 01 Python
Python正则表达式使用经典实例
Jun 21 Python
Python读取图片属性信息的实现方法
Sep 11 Python
python3.4用函数操作mysql5.7数据库
Jun 23 Python
python调用Delphi写的Dll代码示例
Dec 05 Python
用python 批量更改图像尺寸到统一大小的方法
Mar 31 Python
python实时获取外部程序输出结果的方法
Jan 12 Python
Django框架模板的使用方法示例
May 25 Python
Python异常模块traceback用法实例分析
Oct 22 Python
TensorFlow2.1.0最新版本安装详细教程
Apr 08 Python
Python模拟伯努利试验和二项分布代码实例
May 27 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
PHP 伪静态技术原理以及突破原理实现介绍
2013/07/12 PHP
dedecms函数分享之获取某一栏目所有子栏目
2014/05/19 PHP
PHP函数按引用传递参数及函数可选参数用法示例
2018/06/04 PHP
laravel添加前台跳转成功页面示例
2019/10/22 PHP
在网页中控制wmplayer播放器
2006/07/01 Javascript
用于判断用户注册时,密码强度的JS代码
2009/01/01 Javascript
javascript 遍历验证所有文本框的值
2009/08/27 Javascript
JQuery学习笔录 简单的JQuery
2012/04/09 Javascript
jquery实现点击TreeView文本父节点展开/折叠子节点
2013/01/10 Javascript
js设置文本框中焦点位置在最后的示例代码(简单实用)
2014/03/04 Javascript
jQuery中wrapInner()方法用法实例
2015/01/16 Javascript
js实现选中页面文字将其分享到新浪微博
2015/11/05 Javascript
微信小程序开发一键登录 获取session_key和openid实例
2016/11/23 Javascript
js实现悬浮窗效果(支持拖动)
2017/03/09 Javascript
Bootstrap与Angularjs的模态框实例代码
2017/08/03 Javascript
基于DOM节点删除之empty和remove的区别(详解)
2017/09/11 Javascript
Vue的elementUI实现自定义主题方法
2018/02/23 Javascript
react中使用swiper的具体方法
2018/05/15 Javascript
通过jquery toggleClass()属性制作文章段落更改背景颜色
2018/05/21 jQuery
使用validate.js实现表单数据提交前的验证方法
2018/09/04 Javascript
vue二级菜单导航点击选中事件的方法
2018/09/12 Javascript
在阿里云服务器上配置CentOS+Nginx+Python+Flask环境
2016/06/18 Python
itchat接口使用示例
2017/10/23 Python
python+pygame简单画板实现代码实例
2017/12/13 Python
Python爬虫通过替换http request header来欺骗浏览器实现登录功能
2018/01/07 Python
python数据处理 根据颜色对图片进行分类的方法
2018/12/08 Python
Tensorflow的梯度异步更新示例
2020/01/23 Python
pytorch 实现在一个优化器中设置多个网络参数的例子
2020/02/20 Python
Python Flask异步发送邮件实现方法解析
2020/08/01 Python
css3进行截取替代js的substring
2013/09/02 HTML / CSS
大四本科生的自我评价
2013/12/30 职场文书
关于十八大的演讲稿
2014/09/15 职场文书
初级职称评定工作总结
2015/08/13 职场文书
python实现简单聊天功能
2021/07/07 Python
MySQL数据库查询进阶之多表查询详解
2022/04/08 MySQL
python高温预警数据获取实例
2022/07/23 Python