使用Python的Scrapy框架十分钟爬取美女图


Posted in Python onDecember 26, 2016

简介

scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫,官方给出的一个简单例子足以证明其强大:

使用Python的Scrapy框架十分钟爬取美女图

快速开发

下面开始10分钟倒计时:

当然开始前,可以先看看之前我们写过的 scrapy 入门文章 《零基础写python爬虫之使用Scrapy框架编写爬虫

1. 初始化项目

scrapy startproject mzt
cd mzt
scrapy genspider meizitu meizitu.com

2. 添加 spider 代码:

定义 scrapy.Item ,添加 image_urls 和 images ,为下载图片做准备。

修改 start_urls 为初始页面, 添加 parse 用于处理列表页, 添加 parse_item 处理项目页面。

使用Python的Scrapy框架十分钟爬取美女图

3. 修改配置文件:

DOWNLOAD_DELAY = 1 # 添加下载延迟配置
ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加图片下载 pipeline
IMAGES_STORE = '.' # 设置图片保存目录

4. 运行项目:

scrapy crawl meizitu

看,项目运行效果图

使用Python的Scrapy框架十分钟爬取美女图

等待一会儿,就是收获的时候了

使用Python的Scrapy框架十分钟爬取美女图

使用Python的Scrapy框架十分钟爬取美女图

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
Python使用urllib2获取网络资源实例讲解
Dec 02 Python
Python的设计模式编程入门指南
Apr 02 Python
在Django中创建第一个静态视图
Jul 15 Python
python实现按任意键继续执行程序
Dec 30 Python
Python 类的继承实例详解
Mar 25 Python
Python的语言类型(详解)
Jun 24 Python
python 中if else 语句的作用及示例代码
Mar 05 Python
django中瀑布流写法实例代码
Oct 14 Python
python使用matplotlib绘制雷达图
Oct 18 Python
python psutil监控进程实例
Dec 17 Python
python进行OpenCV实战之画图(直线、矩形、圆形)
Aug 27 Python
python 如何用map()函数创建多线程任务
Apr 07 Python
Python中如何获取类属性的列表
Dec 26 #Python
Python中强大的命令行库click入门教程
Dec 26 #Python
Python快速从注释生成文档的方法
Dec 26 #Python
浅谈Python类的__getitem__和__setitem__特殊方法
Dec 25 #Python
解决pyqt中ui编译成窗体.py中文乱码的问题
Dec 23 #Python
详解python进行mp3格式判断
Dec 23 #Python
详解python发送各类邮件的主要方法
Dec 22 #Python
You might like
PHP调用三种数据库的方法(3)
2006/10/09 PHP
解析file_get_contents模仿浏览器头(user_agent)获取数据
2013/06/27 PHP
php中call_user_func函数使用注意事项
2014/11/21 PHP
PHP在线调试执行的实现方法(附demo源码)
2016/04/28 PHP
php实现将HTML页面转换成word并且保存的方法
2016/10/14 PHP
PHP商品秒杀问题解决方案实例详解【mysql与redis】
2019/07/22 PHP
jQuery数组处理代码详解(含实例演示)
2012/02/03 Javascript
Extjs4 消息框去掉关闭按钮(类似Ext.Msg.alert)
2013/04/02 Javascript
jQuery 隐藏和显示 input 默认值示例
2014/06/03 Javascript
使用JavaScript和C#中获得referer
2014/11/14 Javascript
jquery实现弹出层效果实例
2015/05/19 Javascript
用move.js库实现百叶窗特效
2017/02/08 Javascript
JavaScript Base64 作为文件上传的实例代码解析
2017/02/14 Javascript
利用jsonp与代理服务器方案解决跨域问题
2017/09/14 Javascript
JavaScript基础心法 数据类型
2018/03/05 Javascript
解决vue-router中的query动态传参问题
2018/03/20 Javascript
Webpack path与publicPath的区别详解
2018/05/03 Javascript
微信小程序 select 下拉框组件功能
2019/09/09 Javascript
vue 解决IOS10低版本白屏的问题
2020/11/17 Javascript
Python BeautifulSoup中文乱码问题的2种解决方法
2014/04/22 Python
python 转换 Javascript %u 字符串为python unicode的代码
2016/09/06 Python
python django下载大的csv文件实现方法分析
2019/07/19 Python
python字符串反转的四种方法详解
2019/12/02 Python
利用python读取YUV文件 转RGB 8bit/10bit通用
2019/12/09 Python
手工制作的男士奢华英国鞋和服装之家:Goodwin Smith
2019/06/21 全球购物
微软马来西亚官方网站:Microsoft马来西亚
2019/11/22 全球购物
意大利值得信赖的在线超级药房:PillolaStore
2020/02/05 全球购物
婚礼新郎父母答谢词
2014/01/16 职场文书
元旦晚会邀请函
2014/02/01 职场文书
函授毕业生自我鉴定范文
2014/03/25 职场文书
中国梦口号
2014/06/13 职场文书
新闻编辑求职信
2014/07/13 职场文书
施工单位安全责任书
2014/07/24 职场文书
机关干部个人对照检查材料思想汇报
2014/09/28 职场文书
导游词之镇江焦山
2019/11/21 职场文书
解决Navicat for Mysql连接报错1251的问题(连接失败)
2021/05/27 MySQL