使用Python的Scrapy框架十分钟爬取美女图


Posted in Python onDecember 26, 2016

简介

scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫,官方给出的一个简单例子足以证明其强大:

使用Python的Scrapy框架十分钟爬取美女图

快速开发

下面开始10分钟倒计时:

当然开始前,可以先看看之前我们写过的 scrapy 入门文章 《零基础写python爬虫之使用Scrapy框架编写爬虫

1. 初始化项目

scrapy startproject mzt
cd mzt
scrapy genspider meizitu meizitu.com

2. 添加 spider 代码:

定义 scrapy.Item ,添加 image_urls 和 images ,为下载图片做准备。

修改 start_urls 为初始页面, 添加 parse 用于处理列表页, 添加 parse_item 处理项目页面。

使用Python的Scrapy框架十分钟爬取美女图

3. 修改配置文件:

DOWNLOAD_DELAY = 1 # 添加下载延迟配置
ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加图片下载 pipeline
IMAGES_STORE = '.' # 设置图片保存目录

4. 运行项目:

scrapy crawl meizitu

看,项目运行效果图

使用Python的Scrapy框架十分钟爬取美女图

等待一会儿,就是收获的时候了

使用Python的Scrapy框架十分钟爬取美女图

使用Python的Scrapy框架十分钟爬取美女图

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
零基础写python爬虫之爬虫框架Scrapy安装配置
Nov 06 Python
深入讲解Python中的迭代器和生成器
Oct 26 Python
python http接口自动化脚本详解
Jan 02 Python
Numpy之random函数使用学习
Jan 29 Python
Python编译为二进制so可执行文件实例
Dec 23 Python
解决python执行较大excel文件openpyxl慢问题
May 15 Python
python如何写try语句
Jul 14 Python
python打开音乐文件的实例方法
Jul 21 Python
Python判断字符串是否为合法标示符操作
Sep 03 Python
Python的3种运行方式:命令行窗口、Python解释器、IDLE的实现
Oct 10 Python
python利用appium实现手机APP自动化的示例
Jan 26 Python
Pytorch 如何加速Dataloader提升数据读取速度
May 28 Python
Python中如何获取类属性的列表
Dec 26 #Python
Python中强大的命令行库click入门教程
Dec 26 #Python
Python快速从注释生成文档的方法
Dec 26 #Python
浅谈Python类的__getitem__和__setitem__特殊方法
Dec 25 #Python
解决pyqt中ui编译成窗体.py中文乱码的问题
Dec 23 #Python
详解python进行mp3格式判断
Dec 23 #Python
详解python发送各类邮件的主要方法
Dec 22 #Python
You might like
php学习之运算符相关概念
2011/06/09 PHP
php遍历所有文件及文件夹的方法深入解析
2013/06/08 PHP
php eval函数一句话木马代码
2015/05/21 PHP
在laravel中实现事务回滚的方法
2019/10/10 PHP
JQuery.get提交页面不跳转的解决方法
2015/01/13 Javascript
JavaScript实现在页面间传值的方法
2015/04/07 Javascript
基于jquery css3实现点击动画弹出表单源码特效
2015/08/31 Javascript
jQuery form插件之formDdata参数校验表单及验证后提交
2016/01/23 Javascript
JavaScript之Map和Set_动力节点Java学院整理
2017/06/29 Javascript
js实现QQ面板拖拽效果(慕课网DOM事件探秘)(全)
2017/09/19 Javascript
妙用缓存调用链实现JS方法的重载
2018/04/30 Javascript
javascript中this的用法实践分析
2019/07/29 Javascript
Vue.js的模板语法详解
2020/02/16 Javascript
[03:59]DOTA2英雄梦之声_第07期_水晶室女
2014/06/23 DOTA
Python编码时应该注意的几个情况
2013/03/04 Python
Python Web框架Pylons中使用MongoDB的例子
2013/12/03 Python
利用Python的装饰器解决Bottle框架中用户验证问题
2015/04/24 Python
Python字符串格式化%s%d%f详解
2018/02/02 Python
详解重置Django migration的常见方式
2019/02/15 Python
python调用动态链接库的基本过程详解
2019/06/19 Python
对Pytorch神经网络初始化kaiming分布详解
2019/08/18 Python
pytorch 实现删除tensor中的指定行列
2020/01/13 Python
学习Python爬虫的几点建议
2020/08/05 Python
python如何设置静态变量
2020/09/07 Python
Python try except else使用详解
2021/01/12 Python
联想澳大利亚官网:Lenovo Australia
2018/01/18 全球购物
英国内衣连锁店:Boux Avenue
2018/01/24 全球购物
杭州信雅达系统.NET工程师面试试题
2015/02/08 面试题
高中生自我评价个人范文
2013/11/09 职场文书
采购员岗位职责
2013/11/15 职场文书
个人授权委托书
2014/04/03 职场文书
市场营销调查计划书
2014/05/02 职场文书
态度决定一切演讲稿
2014/05/20 职场文书
应届生自荐书
2014/06/23 职场文书
个人债务授权委托书范本
2014/10/05 职场文书
Java Spring Lifecycle的使用
2022/05/06 Java/Android