使用Python的Scrapy框架十分钟爬取美女图


Posted in Python onDecember 26, 2016

简介

scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫,官方给出的一个简单例子足以证明其强大:

使用Python的Scrapy框架十分钟爬取美女图

快速开发

下面开始10分钟倒计时:

当然开始前,可以先看看之前我们写过的 scrapy 入门文章 《零基础写python爬虫之使用Scrapy框架编写爬虫

1. 初始化项目

scrapy startproject mzt
cd mzt
scrapy genspider meizitu meizitu.com

2. 添加 spider 代码:

定义 scrapy.Item ,添加 image_urls 和 images ,为下载图片做准备。

修改 start_urls 为初始页面, 添加 parse 用于处理列表页, 添加 parse_item 处理项目页面。

使用Python的Scrapy框架十分钟爬取美女图

3. 修改配置文件:

DOWNLOAD_DELAY = 1 # 添加下载延迟配置
ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加图片下载 pipeline
IMAGES_STORE = '.' # 设置图片保存目录

4. 运行项目:

scrapy crawl meizitu

看,项目运行效果图

使用Python的Scrapy框架十分钟爬取美女图

等待一会儿,就是收获的时候了

使用Python的Scrapy框架十分钟爬取美女图

使用Python的Scrapy框架十分钟爬取美女图

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
Python的Django框架中的表单处理示例
Jul 17 Python
Python中MySQL数据迁移到MongoDB脚本的方法
Apr 28 Python
Flask框架的学习指南之用户登录管理
Nov 20 Python
python做量化投资系列之比特币初始配置
Jan 23 Python
Python Requests模拟登录实现图书馆座位自动预约
Apr 27 Python
Python多线程处理实例详解【单进程/多进程】
Jan 30 Python
python识别图像并提取文字的实现方法
Jun 28 Python
利用Python检测URL状态
Jul 31 Python
python 安装教程之Pycharm安装及配置字体主题,换行,自动更新
Mar 13 Python
Python装饰器实现方法及应用场景详解
Mar 26 Python
解决Alexnet训练模型在每个epoch中准确率和loss都会一升一降问题
Jun 17 Python
python如何将图片转换素描画
Sep 08 Python
Python中如何获取类属性的列表
Dec 26 #Python
Python中强大的命令行库click入门教程
Dec 26 #Python
Python快速从注释生成文档的方法
Dec 26 #Python
浅谈Python类的__getitem__和__setitem__特殊方法
Dec 25 #Python
解决pyqt中ui编译成窗体.py中文乱码的问题
Dec 23 #Python
详解python进行mp3格式判断
Dec 23 #Python
详解python发送各类邮件的主要方法
Dec 22 #Python
You might like
PHP去掉从word直接粘贴过来的没有用格式的函数
2012/10/29 PHP
探讨fckeditor在Php中的配置详解
2013/06/08 PHP
PHP strstr 函数判断字符串是否否存在的实例代码
2013/09/28 PHP
PHP自带方法验证邮箱、URL、IP是否合法的函数
2016/12/08 PHP
对laravel的csrf 防御机制详解,及form中csrf_token()的存在介绍
2019/10/24 PHP
PHP7移除的扩展和SAPI
2021/03/09 PHP
使用TextRange获取输入框中光标的位
2006/10/14 Javascript
自己的js工具_Form 封装
2009/08/21 Javascript
js阻止冒泡及jquery阻止事件冒泡示例介绍
2013/11/19 Javascript
JS实现仿新浪微博发布内容为空时提示功能代码
2015/08/19 Javascript
asp知识整理笔记3(问答模式)
2015/09/27 Javascript
详解javascript表单的Ajax提交插件的使用
2016/12/29 Javascript
借助node实战JSONP跨域实例
2017/03/30 Javascript
原生JavaScript实现的简单省市县三级联动功能示例
2017/05/27 Javascript
JavaScript 中的 this 简单规则
2017/09/19 Javascript
浅谈如何使用webpack构建多页面应用
2018/05/30 Javascript
Vue自定义全局Toast和Loading的实例详解
2019/04/18 Javascript
Vue3.0结合bootstrap创建多页面应用
2019/05/28 Javascript
vue实现一个6个输入框的验证码输入组件功能的实例代码
2020/06/29 Javascript
在Python的Flask框架中实现全文搜索功能
2015/04/20 Python
python3批量删除豆瓣分组下的好友的实现代码
2016/06/07 Python
Python实现冒泡排序的简单应用示例
2017/12/11 Python
python中使用iterrows()对dataframe进行遍历的实例
2018/06/09 Python
python3 实现对图片进行局部切割的方法
2018/12/05 Python
python爬虫刷访问量 2019 7月
2019/08/01 Python
利用python-docx模块写批量生日邀请函
2019/08/26 Python
matlab中imadjust函数的作用及应用举例
2020/02/27 Python
Python3利用openpyxl读写Excel文件的方法实例
2021/02/03 Python
CSS3 Backgrounds属性相关介绍
2011/05/11 HTML / CSS
css实例教程 一款纯css3实现的超炫动画背画特效
2014/11/05 HTML / CSS
英国体育器材进口商店:UK Sport Imports
2017/03/14 全球购物
公司行政经理岗位职责
2013/12/24 职场文书
内衣营销方案
2014/03/15 职场文书
讲文明树新风演讲稿
2014/05/12 职场文书
2014年会计工作总结
2014/11/27 职场文书
python实现Thrift服务端的方法
2021/04/20 Python