使用Python的Scrapy框架十分钟爬取美女图


Posted in Python onDecember 26, 2016

简介

scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫,官方给出的一个简单例子足以证明其强大:

使用Python的Scrapy框架十分钟爬取美女图

快速开发

下面开始10分钟倒计时:

当然开始前,可以先看看之前我们写过的 scrapy 入门文章 《零基础写python爬虫之使用Scrapy框架编写爬虫

1. 初始化项目

scrapy startproject mzt
cd mzt
scrapy genspider meizitu meizitu.com

2. 添加 spider 代码:

定义 scrapy.Item ,添加 image_urls 和 images ,为下载图片做准备。

修改 start_urls 为初始页面, 添加 parse 用于处理列表页, 添加 parse_item 处理项目页面。

使用Python的Scrapy框架十分钟爬取美女图

3. 修改配置文件:

DOWNLOAD_DELAY = 1 # 添加下载延迟配置
ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加图片下载 pipeline
IMAGES_STORE = '.' # 设置图片保存目录

4. 运行项目:

scrapy crawl meizitu

看,项目运行效果图

使用Python的Scrapy框架十分钟爬取美女图

等待一会儿,就是收获的时候了

使用Python的Scrapy框架十分钟爬取美女图

使用Python的Scrapy框架十分钟爬取美女图

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
python 生成不重复的随机数的代码
May 15 Python
Python实现全局变量的两个解决方法
Jul 03 Python
在Python的Django框架上部署ORM库的教程
Apr 20 Python
python引用DLL文件的方法
May 11 Python
Python 编码处理-str与Unicode的区别
Sep 06 Python
Python实现的多线程http压力测试代码
Feb 08 Python
python爬虫实战之爬取京东商城实例教程
Apr 24 Python
利用python批量修改word文件名的方法示例
Oct 17 Python
Python基于win32ui模块创建弹出式菜单示例
May 09 Python
Python中偏函数用法示例
Jun 07 Python
python智联招聘爬虫并导入到excel代码实例
Sep 09 Python
python3中利用filter函数输出小于某个数的所有回文数实例
Nov 24 Python
Python中如何获取类属性的列表
Dec 26 #Python
Python中强大的命令行库click入门教程
Dec 26 #Python
Python快速从注释生成文档的方法
Dec 26 #Python
浅谈Python类的__getitem__和__setitem__特殊方法
Dec 25 #Python
解决pyqt中ui编译成窗体.py中文乱码的问题
Dec 23 #Python
详解python进行mp3格式判断
Dec 23 #Python
详解python发送各类邮件的主要方法
Dec 22 #Python
You might like
星际争霸中的热键
2020/03/04 星际争霸
PHP中的extract的作用分析
2008/04/09 PHP
通过dbi使用perl连接mysql数据库的方法
2014/04/16 PHP
PHP使用array_multisort对多个数组或多维数组进行排序
2014/12/16 PHP
Javascript实现的分页函数
2006/12/22 Javascript
jQuery TextBox自动完成条
2009/07/22 Javascript
javascript 得到变量类型的函数
2010/05/19 Javascript
De facto standard 世界上不可思议的事实标准
2010/08/29 Javascript
超越Jquery_01_isPlainObject分析与重构
2010/10/20 Javascript
js 3种归并操作的实例代码
2013/10/30 Javascript
采用自执行的匿名函数解决for循环使用闭包的问题
2014/09/11 Javascript
JavaScript动态检验密码强度的实现方法
2016/11/09 Javascript
JS制作类似选项卡切换的年历
2016/12/03 Javascript
jQuery Easyui 下拉树组件combotree
2016/12/16 Javascript
NodeJS设计模式总结【单例模式,适配器模式,装饰模式,观察者模式】
2017/09/06 NodeJs
Layui表格行工具事件与数据回填方法
2019/09/13 Javascript
用smtplib和email封装python发送邮件模块类分享
2014/02/17 Python
Python中的面向对象编程详解(下)
2015/04/13 Python
讲解Python中fileno()方法的使用
2015/05/24 Python
Python3连接SQLServer、Oracle、MySql的方法
2018/06/28 Python
使用python实现抓取腾讯视频所有电影的爬虫
2019/04/15 Python
jupyter notebook 中输出pyecharts图实例
2020/04/23 Python
用django-allauth实现第三方登录的示例代码
2019/06/24 Python
解决pycharm 工具栏Tool中找不到Run manager.py Task的问题
2019/07/01 Python
Python学习笔记之文件的读写操作实例分析
2019/08/07 Python
pymysql的简单封装代码实例
2020/01/08 Python
CSS3中的Media Queries学习笔记
2016/05/23 HTML / CSS
马来西亚在线健康商店:Medipal Malaysia
2020/04/13 全球购物
库房主管岗位职责
2013/12/31 职场文书
九年级政治教学反思
2014/02/06 职场文书
音乐专业自荐信
2014/02/07 职场文书
2014年大学生四年规划书范文
2014/04/03 职场文书
《他得的红圈圈最多》教学反思
2014/04/24 职场文书
新学期感想
2015/08/10 职场文书
财产分割协议书
2016/03/22 职场文书
导游词之安徽九华山
2019/09/18 职场文书