编程 Python

使用Python的Scrapy框架十分钟爬取美女图

Posted in Python onDecember 26, 2016

简介

scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫，官方给出的一个简单例子足以证明其强大：

快速开发

下面开始10分钟倒计时：

当然开始前，可以先看看之前我们写过的 scrapy 入门文章《零基础写python爬虫之使用Scrapy框架编写爬虫

1. 初始化项目

scrapy startproject mzt
cd mzt
scrapy genspider meizitu meizitu.com

2. 添加 spider 代码：

定义 scrapy.Item ，添加 image_urls 和 images ，为下载图片做准备。

修改 start_urls 为初始页面, 添加 parse 用于处理列表页，添加 parse_item 处理项目页面。

使用Python的Scrapy框架十分钟爬取美女图

3. 修改配置文件：

DOWNLOAD_DELAY = 1 # 添加下载延迟配置
ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加图片下载 pipeline
IMAGES_STORE = '.' # 设置图片保存目录

4. 运行项目：

scrapy crawl meizitu

看，项目运行效果图

使用Python的Scrapy框架十分钟爬取美女图

等待一会儿，就是收获的时候了

使用Python的Scrapy框架十分钟爬取美女图

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流。

使用Python的Scrapy框架十分钟爬取美女图

- Author -

strivescript

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python使用urllib2获取网络资源实例讲解

Dec 02 Python

Python的设计模式编程入门指南

Apr 02 Python

在Django中创建第一个静态视图

Jul 15 Python

python实现按任意键继续执行程序

Dec 30 Python

Python 类的继承实例详解

Mar 25 Python

Python的语言类型(详解)

Jun 24 Python

python 中if else 语句的作用及示例代码

Mar 05 Python

django中瀑布流写法实例代码

Oct 14 Python

python使用matplotlib绘制雷达图

Oct 18 Python

python psutil监控进程实例

Dec 17 Python

python进行OpenCV实战之画图（直线、矩形、圆形）

Aug 27 Python

python 如何用map()函数创建多线程任务

Apr 07 Python

Python中如何获取类属性的列表

Dec 26 #Python

Python中强大的命令行库click入门教程

Dec 26 #Python

Python快速从注释生成文档的方法

Dec 26 #Python

浅谈Python类的__getitem__和__setitem__特殊方法

Dec 25 #Python

解决pyqt中ui编译成窗体.py中文乱码的问题

Dec 23 #Python

详解python进行mp3格式判断

Dec 23 #Python

详解python发送各类邮件的主要方法

Dec 22 #Python

You might like

PHP调用三种数据库的方法(3)

2006/10/09 PHP

解析file_get_contents模仿浏览器头(user_agent)获取数据

2013/06/27 PHP

php中call_user_func函数使用注意事项

2014/11/21 PHP

PHP在线调试执行的实现方法(附demo源码)

2016/04/28 PHP

php实现将HTML页面转换成word并且保存的方法

2016/10/14 PHP

PHP商品秒杀问题解决方案实例详解【mysql与redis】

2019/07/22 PHP

jQuery数组处理代码详解(含实例演示)

2012/02/03 Javascript

Extjs4 消息框去掉关闭按钮(类似Ext.Msg.alert)

2013/04/02 Javascript

jQuery 隐藏和显示 input 默认值示例

2014/06/03 Javascript

使用JavaScript和C#中获得referer

2014/11/14 Javascript

jquery实现弹出层效果实例

2015/05/19 Javascript

用move.js库实现百叶窗特效

2017/02/08 Javascript

JavaScript Base64 作为文件上传的实例代码解析

2017/02/14 Javascript

利用jsonp与代理服务器方案解决跨域问题

2017/09/14 Javascript

JavaScript基础心法数据类型

2018/03/05 Javascript

解决vue-router中的query动态传参问题

2018/03/20 Javascript

Webpack path与publicPath的区别详解

2018/05/03 Javascript

微信小程序 select 下拉框组件功能

2019/09/09 Javascript

vue 解决IOS10低版本白屏的问题

2020/11/17 Javascript

Python BeautifulSoup中文乱码问题的2种解决方法

2014/04/22 Python

python 转换 Javascript %u 字符串为python unicode的代码

2016/09/06 Python

python django下载大的csv文件实现方法分析

2019/07/19 Python

python字符串反转的四种方法详解

2019/12/02 Python

利用python读取YUV文件转RGB 8bit/10bit通用

2019/12/09 Python

手工制作的男士奢华英国鞋和服装之家：Goodwin Smith

2019/06/21 全球购物

微软马来西亚官方网站：Microsoft马来西亚

2019/11/22 全球购物

意大利值得信赖的在线超级药房：PillolaStore

2020/02/05 全球购物

婚礼新郎父母答谢词

2014/01/16 职场文书

元旦晚会邀请函

2014/02/01 职场文书

函授毕业生自我鉴定范文

2014/03/25 职场文书

中国梦口号

2014/06/13 职场文书

新闻编辑求职信

2014/07/13 职场文书

施工单位安全责任书

2014/07/24 职场文书

机关干部个人对照检查材料思想汇报

2014/09/28 职场文书

导游词之镇江焦山

2019/11/21 职场文书

解决Navicat for Mysql连接报错1251的问题(连接失败)

2021/05/27 MySQL