实操Python爬取觅知网素材图片示例


Posted in Python onNovember 27, 2021

【一、项目背景】

   在素材网想找到合适图片需要一页一页往下翻,现在学会python就可以用程序把所有图片保存下来,慢慢挑选合适的图片。

【二、项目目标】

1、根据给定的网址获取网页源代码。

2、利用正则表达式把源代码中的图片地址过滤出来。

3、过滤出来的图片地址下载素材图片。

【三、涉及的库和网站】

1、网址如下:

https://www.51miz.com/

2、涉及的库:requests、lxml

【四、项目分析】

   首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:

https://www.51miz.com/so-sucai/1789243.html
https://www.51miz.com/so-sucai/1789243/p_2/
https://www.51miz.com/so-sucai/1789243/p_3/

   我们可以发现图片页数是1789243/p{},p{}花括号数字表示图片哪一页。

【五、项目实施】

1、打开觅知网,在搜索中输入你想要的图片素材(以鼠年素材图片为例)。

实操Python爬取觅知网素材图片示例 

2、根据上一步对网址的分析,首先我们定义一个类叫做ImageSpider,类里面定义初始化函数、发送请求获取响应数据函数、解析函数、主函数。首先初始化函数,准备url地址和headers,代码如下图所示。

实操Python爬取觅知网素材图片示例

3、发送请求获取响应数据函数。

实操Python爬取觅知网素材图片示例

4、解析数据,使用xpath获取二级页面链接,最后把图片存储在文件夹中。使用谷歌浏览器选择开发者工具或直接按F12,发现我们需要的图片src是在img标签下的,于是用Python的requests提取该组件。

实操Python爬取觅知网素材图片示例

实操Python爬取觅知网素材图片示例

5、主函数,代码如下图所示。

实操Python爬取觅知网素材图片示例

【六、效果展示】

1、运行程序,在控制台输入你要爬取的页数,如下图所示。

实操Python爬取觅知网素材图片示例

2、在本地可以看到效果图,如下图所示。

实操Python爬取觅知网素材图片示例

【七、总结】

   1、不建议抓取太多数据,容易对服务器造成负载,浅尝辄止即可。

   2、希望通过这个项目,能够帮助大家下载到素材图片。

   3、本文基于Python网络爬虫,利用爬虫库,实现素材图片的获取。实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。

到此这篇关于实操Python爬取觅知网素材图片示例的文章就介绍到这了,更多相关Python爬取觅知网素材图片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python分析apache访问日志脚本分享
Feb 26 Python
Python日志模块logging简介
Apr 13 Python
使用Turtle画正螺旋线的方法
Sep 22 Python
对python3 中方法各种参数和返回值详解
Dec 15 Python
在Pycharm中将pyinstaller加入External Tools的方法
Jan 16 Python
python中的Elasticsearch操作汇总
Oct 30 Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 Python
flask的orm框架SQLAlchemy查询实现解析
Dec 12 Python
Python抓包程序mitmproxy安装和使用过程图解
Mar 02 Python
深入了解Python 方法之类方法 & 静态方法
Aug 17 Python
Python hashlib模块的使用示例
Oct 09 Python
Python通过format函数格式化显示值
Oct 17 Python
Python函数中apply、map、applymap的区别
Nov 27 #Python
python字符串拼接.join()和拆分.split()详解
Nov 23 #Python
Python装饰器的练习题
Nov 23 #Python
python人工智能human learn绘图可创建机器学习模型
利用Python实现Picgo图床工具
Nov 23 #Python
python turtle绘图命令及案例
python机器学习Github已达8.9Kstars模型解释器LIME
You might like
php实现小程序支付完整版
2018/10/09 PHP
Gambit vs ForZe BO3 第一场 2.13
2021/03/10 DOTA
用ASP将SQL搜索出来的内容导出为TXT的代码
2007/07/27 Javascript
用JS实现一个页面多个css样式实现
2008/05/29 Javascript
兼容ie和firefox js关闭代码
2008/12/11 Javascript
JavaScript设置FieldSet展开与收缩
2009/05/15 Javascript
使用按钮控制以何种方式打开新窗口的属性介绍
2012/12/17 Javascript
Jquery AJAX POST与GET之间的区别
2013/11/14 Javascript
JavaScript对数字的判断与处理实例分析
2015/02/02 Javascript
jquery简单实现图片切换效果的方法
2015/05/12 Javascript
Backbone中View之间传值的学习心得
2016/08/09 Javascript
EasyUI 结合JS导出Excel文件的实现方法
2016/11/10 Javascript
Vue SPA单页应用首屏优化实践
2018/06/28 Javascript
微信小程序实现弹出层效果
2020/05/26 Javascript
vue滚动插件better-scroll使用详解
2019/10/18 Javascript
基于JS正则表达式实现模板数据动态渲染(实现思路详解)
2020/03/07 Javascript
vue-cli3项目打包后自动化部署到服务器的方法
2020/09/16 Javascript
centos 安装python3.6环境并配置虚拟环境的详细教程
2018/02/22 Python
解决Pycharm出现的部分快捷键无效问题
2018/10/22 Python
Python判断变量名是否合法的方法示例
2019/01/28 Python
python 梯度法求解函数极值的实例
2019/07/10 Python
python requests指定出口ip的例子
2019/07/25 Python
django-rest-swagger对API接口注释的方法
2019/08/29 Python
Python之Numpy的超实用基础详细教程
2019/10/23 Python
用python制作个音乐下载器
2021/01/30 Python
德国最大的服装、鞋子和配件在线商店之一:Outfits24
2019/07/23 全球购物
美国波西米亚风格精品店:South Moon Under
2019/10/26 全球购物
Spartoo美国:欧洲排名第一的在线时装零售商
2019/12/12 全球购物
日本亚马逊官方网站:Amazon.co.jp
2020/04/14 全球购物
企业项目策划书
2014/01/11 职场文书
销售简历自我评价
2014/01/24 职场文书
作风大整顿心得体会
2014/09/10 职场文书
邀请函模板
2015/02/02 职场文书
2016年感恩教师节校园广播稿
2015/12/18 职场文书
安全教育培训心得体会
2016/01/15 职场文书
微信小程序实现轮播图指示器
2022/06/25 Javascript