python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python科学计算之NumPy入门教程
Jan 15 Python
Python嵌套列表转一维的方法(压平嵌套列表)
Jul 03 Python
Python 多线程不加锁分块读取文件的方法
Dec 11 Python
Python语言进阶知识点总结
May 28 Python
Python pandas DataFrame操作的实现代码
Jun 21 Python
Django中提供的6种缓存方式详解
Aug 05 Python
关于Python核心框架tornado的异步协程的2种方法详解
Aug 28 Python
基于python实现雪花算法过程详解
Nov 16 Python
python 列表、字典和集合的添加和删除操作
Dec 16 Python
Python坐标轴操作及设置代码实例
Jun 04 Python
Python 合并拼接字符串的方法
Jul 28 Python
解决pytorch下出现multi-target not supported at的一种可能原因
Feb 06 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
md5 16位二进制与32位字符串相互转换示例
2013/12/30 PHP
php采用ajax数据提交post与post常见方法总结
2014/11/10 PHP
php删除左端与右端空格的方法
2014/11/29 PHP
php通过asort()给关联数组按照值排序的方法
2015/03/18 PHP
PHP 结合 Boostrap 结合 js 实现学生列表删除编辑及搜索功能
2019/05/21 PHP
javascript oop开发滑动(slide)菜单控件
2010/08/25 Javascript
为你的网站增加亮点的9款jQuery插件推荐
2011/05/03 Javascript
jQuery登陆判断简单实现代码
2013/04/21 Javascript
js固定DIV高度,超出部分自动添加滚动条的简单方法
2013/07/10 Javascript
批量修改标签css样式以input标签为例
2014/07/31 Javascript
javascript实现修改微信分享的标题内容等
2014/12/11 Javascript
基于JavaScript实现移动端点击图片查看大图点击大图隐藏
2015/11/04 Javascript
js+canvas绘制五角星的方法
2016/01/28 Javascript
Angular在模板驱动表单中自定义校验器的方法
2017/08/09 Javascript
微信小程序仿美团城市选择
2018/06/06 Javascript
validform表单验证的实现方法
2019/03/08 Javascript
微信小程序Page中data数据操作和函数调用方法
2019/05/08 Javascript
ant-design-vue中的select选择器,对输入值的进行筛选操作
2020/10/24 Javascript
Vue路由权限控制解析
2020/11/09 Javascript
微信小程序实现通讯录列表展开收起
2020/11/18 Javascript
[02:52]2017DOTA2国际邀请赛中国区预选赛晋级之路
2017/07/03 DOTA
python实战之实现excel读取、统计、写入的示例讲解
2018/05/02 Python
使用python进行广告点击率的预测的实现
2019/07/04 Python
python 利用turtle模块画出没有角的方格
2019/11/23 Python
python离线安装外部依赖包的实现
2020/02/13 Python
Python ArgumentParse的subparser用法说明
2020/04/20 Python
基于PyQT实现区分左键双击和单击
2020/05/19 Python
python如何删除列为空的行
2020/07/17 Python
NYX Professional Makeup官方网站:专业彩妆和美容产品
2019/10/29 全球购物
俄罗斯鲜花递送:AMF
2020/04/24 全球购物
酒店中秋节活动方案
2014/01/31 职场文书
经营理念口号
2014/06/21 职场文书
2014年护理工作总结范文
2014/11/14 职场文书
2015关爱留守儿童工作总结
2014/12/12 职场文书
师德先进个人材料
2014/12/20 职场文书
银行客户经理培训心得体会
2016/01/09 职场文书