实操Python爬取觅知网素材图片示例


Posted in Python onNovember 27, 2021

【一、项目背景】

   在素材网想找到合适图片需要一页一页往下翻,现在学会python就可以用程序把所有图片保存下来,慢慢挑选合适的图片。

【二、项目目标】

1、根据给定的网址获取网页源代码。

2、利用正则表达式把源代码中的图片地址过滤出来。

3、过滤出来的图片地址下载素材图片。

【三、涉及的库和网站】

1、网址如下:

https://www.51miz.com/

2、涉及的库:requests、lxml

【四、项目分析】

   首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:

https://www.51miz.com/so-sucai/1789243.html
https://www.51miz.com/so-sucai/1789243/p_2/
https://www.51miz.com/so-sucai/1789243/p_3/

   我们可以发现图片页数是1789243/p{},p{}花括号数字表示图片哪一页。

【五、项目实施】

1、打开觅知网,在搜索中输入你想要的图片素材(以鼠年素材图片为例)。

实操Python爬取觅知网素材图片示例 

2、根据上一步对网址的分析,首先我们定义一个类叫做ImageSpider,类里面定义初始化函数、发送请求获取响应数据函数、解析函数、主函数。首先初始化函数,准备url地址和headers,代码如下图所示。

实操Python爬取觅知网素材图片示例

3、发送请求获取响应数据函数。

实操Python爬取觅知网素材图片示例

4、解析数据,使用xpath获取二级页面链接,最后把图片存储在文件夹中。使用谷歌浏览器选择开发者工具或直接按F12,发现我们需要的图片src是在img标签下的,于是用Python的requests提取该组件。

实操Python爬取觅知网素材图片示例

实操Python爬取觅知网素材图片示例

5、主函数,代码如下图所示。

实操Python爬取觅知网素材图片示例

【六、效果展示】

1、运行程序,在控制台输入你要爬取的页数,如下图所示。

实操Python爬取觅知网素材图片示例

2、在本地可以看到效果图,如下图所示。

实操Python爬取觅知网素材图片示例

【七、总结】

   1、不建议抓取太多数据,容易对服务器造成负载,浅尝辄止即可。

   2、希望通过这个项目,能够帮助大家下载到素材图片。

   3、本文基于Python网络爬虫,利用爬虫库,实现素材图片的获取。实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。

到此这篇关于实操Python爬取觅知网素材图片示例的文章就介绍到这了,更多相关Python爬取觅知网素材图片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现ip查询示例
Mar 26 Python
Python Web开发模板引擎优缺点总结
May 06 Python
Python2实现的LED大数字显示效果示例
Sep 04 Python
Django读取Mysql数据并显示在前端的实例
May 27 Python
python将回车作为输入内容的实例
Jun 23 Python
Python实现数据结构线性链表(单链表)算法示例
May 04 Python
详解Python中的各种转义符\n\r\t
Jul 10 Python
python的range和linspace使用详解
Nov 27 Python
python设置环境变量的作用整理
Feb 17 Python
python爬虫中的url下载器用法详解
Nov 30 Python
python可视化分析的实现(matplotlib、seaborn、ggplot2)
Feb 03 Python
Python基础之教你怎么在M1系统上使用pandas
May 08 Python
Python函数中apply、map、applymap的区别
Nov 27 #Python
python字符串拼接.join()和拆分.split()详解
Nov 23 #Python
Python装饰器的练习题
Nov 23 #Python
python人工智能human learn绘图可创建机器学习模型
利用Python实现Picgo图床工具
Nov 23 #Python
python turtle绘图命令及案例
python机器学习Github已达8.9Kstars模型解释器LIME
You might like
php mssql 分页SQL语句优化 持续影响
2009/04/26 PHP
PHP错误Allowed memory size of 67108864 bytes exhausted的3种解决办法
2014/07/28 PHP
全面解读PHP的人气开发框架Laravel
2015/10/15 PHP
在WordPress中使用wp_count_posts函数来统计文章数量
2016/01/05 PHP
ie focus bug 解决方法
2009/09/03 Javascript
JavaScript高级程序设计(第3版)学习笔记4 js运算符和操作符
2012/10/11 Javascript
jQuery验证元素是否为空的两种常用方法
2015/03/17 Javascript
jQuery Validate表单验证深入学习
2015/12/18 Javascript
JQuery+EasyUI轻松实现步骤条效果
2016/02/22 Javascript
几种经典排序算法的JS实现方法
2016/03/25 Javascript
js 创建对象 经典模式全面了解
2016/08/16 Javascript
javascript流程控制语句集合
2017/09/18 Javascript
layer弹出层全屏及关闭方法
2018/08/17 Javascript
vue-cli整合vuex的时候,修改actions和mutations,实现热部署的方法
2018/09/19 Javascript
vue中在vuex的actions中请求数据实例
2019/11/08 Javascript
基于Web Audio API实现音频可视化效果
2020/06/12 Javascript
vue自定义树状结构图的实现方法
2020/10/18 Javascript
Python聊天室程序(基础版)
2018/04/01 Python
numpy中的meshgrid函数的使用
2019/07/31 Python
Django应用程序入口WSGIHandler源码解析
2019/08/05 Python
python取均匀不重复的随机数方式
2019/11/27 Python
Python pandas如何向excel添加数据
2020/05/22 Python
Python中socket网络通信是干嘛的
2020/05/27 Python
CSS3自定义滚动条样式的示例代码
2017/08/21 HTML / CSS
Clarks鞋美国官网:全球领军鞋履品牌
2017/05/13 全球购物
PAUL HEWITT手表美国站:德国北部时尚生活配饰品牌,船锚元素
2017/11/18 全球购物
Koral官方网站:女性时尚运动服
2019/04/10 全球购物
英国名牌服装购物网站:OD’s Designer
2019/09/02 全球购物
司机检讨书
2014/02/13 职场文书
暑期教师培训方案
2014/06/07 职场文书
2014大学生职业生涯规划书最新范文
2014/09/13 职场文书
车辆年检委托书范本
2014/10/14 职场文书
党员对十八届四中全会的期盼思想汇报范文
2014/10/17 职场文书
2015年计算机教师工作总结
2015/07/22 职场文书
Mysql 性能监控及调优
2021/04/06 MySQL
Redis中缓存穿透/击穿/雪崩问题和解决方法
2021/12/04 Redis