详解Python静态网页爬取获取高清壁纸


Posted in Python onApril 23, 2019

前言

在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤

一般地,我们去网上批量打开壁纸的时候一般操作如下:

1、打开壁纸网页

2、单击壁纸图(打开指定壁纸的页面)

3、选择分辨率(我们要下载高清的图)

4、保存图片

实际操作时,我们实现了如下几步网页地址的访问:打开了壁纸的网页→单击壁纸图打开指定页面→选择分辨率,点击后打开最终保存目标图片网页→保存图片

在爬虫的过程中我们就尝试通过模拟浏览器打开网页的操作,一步步获得、访问网页、最后获得目标图片的下载地址,对图片进行下载保存到指定路径中

*这些中间过程中网页的一些具体筛选条件的构造,需要打开指定页面的源代码去观察和寻找包含有目的链接的标签

具体实现项目与注释

这里我只想获得一些指定的图片,所以我先在网页上搜索“长门有希”,打开了一个搜索结果页面,发现在这个页面上就已经包含了同类型的其他壁纸链接,于是我一开始就把最初访问的目的地址设置为这个搜索结果页面

目标结果页面截图:

详解Python静态网页爬取获取高清壁纸

图中下标为"1/29"."2/29"为其他同类型目标壁纸,通过点击这些图片我们可以打开新的目标下载图片页面

这里我们查看一下网页源代码

详解Python静态网页爬取获取高清壁纸

图中黄色底的地方就是打开这些同类壁纸的目的地址(访问的时候需要加上前缀"http://desk.zol.com.cn")

现在我们可以尝试实现构建爬虫:

打开指定页面→筛选获得所有长门有希壁纸的目标下载页面链接

代码如下:

详解Python静态网页爬取获取高清壁纸

获得地址以后我们可以通过获取地址→打开指定页面→选择分辨率→获得目的下载地址→保存到本地指定路径中

在测试的时候我输出了一下上一步truelist中保存的内容

 详解Python静态网页爬取获取高清壁纸

可以看到保存的只是一个后缀,在访问的时候我们需要加上一个指定的前缀

实现代码如下(注释见代码):

详解Python静态网页爬取获取高清壁纸

 最后可以在自己的目标文件夹中看到爬下来的图片集~

详解Python静态网页爬取获取高清壁纸

以上所述是小编给大家介绍的Python爬取高清壁纸详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
开源Web应用框架Django图文教程
Mar 09 Python
Python多进程库multiprocessing中进程池Pool类的使用详解
Nov 24 Python
tornado 多进程模式解析
Jan 15 Python
python矩阵/字典实现最短路径算法
Jan 17 Python
详解Python3注释知识点
Feb 19 Python
python自带tkinter库实现棋盘覆盖图形界面
Jul 17 Python
python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片)
Aug 06 Python
Django rest framework jwt的使用方法详解
Aug 08 Python
谈一谈数组拼接tf.concat()和np.concatenate()的区别
Feb 07 Python
python绘制玫瑰的实现代码
Mar 02 Python
Django rest framework分页接口实现原理解析
Aug 21 Python
Python  lambda匿名函数和三元运算符
Apr 19 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 #Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 #Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
You might like
数据库查询记录php 多行多列显示
2009/08/15 PHP
PHP设计模式之解释器模式的深入解析
2013/06/13 PHP
php利用单例模式实现日志处理类库
2014/02/10 PHP
PHP多维数组转一维数组的简单实现方法
2015/12/23 PHP
php mysql_real_escape_string addslashes及mysql绑定参数防SQL注入攻击
2016/12/23 PHP
TP5框架实现的数据库备份功能示例
2020/04/05 PHP
jQuery源码分析-03构造jQuery对象-源码结构和核心函数
2011/11/14 Javascript
Three.js源码阅读笔记(基础的核心Core对象)
2012/12/27 Javascript
jquery实现商品拖动选择效果代码(自写)
2013/05/28 Javascript
jQuery延迟加载图片插件Lazy Load使用指南
2015/03/25 Javascript
通过点击jqgrid表格弹出需要的表格数据
2015/12/02 Javascript
jQuery点击按钮弹出遮罩层且内容居中特效
2015/12/14 Javascript
javascript使用Promise对象实现异步编程
2016/03/01 Javascript
使用jQuery5分钟快速搞定双色表格的简单实例
2016/08/08 Javascript
jQuery图片前后对比插件beforeAfter用法示例【附demo源码下载】
2016/09/20 Javascript
微信小程序 九宫格实例代码
2017/01/21 Javascript
JS中cookie的使用及缺点讲解
2017/05/13 Javascript
vue的一个分页组件的示例代码
2017/12/25 Javascript
JS中利用FileReader实现上传图片前本地预览功能
2018/03/02 Javascript
Angular6封装http请求的步骤详解
2018/08/13 Javascript
vue 使用html2canvas将DOM转化为图片的方法
2018/09/11 Javascript
浅谈Javascript常用正则表达式应用
2019/03/08 Javascript
vue实现编辑器键盘抬起时内容跟随光标距顶位置向上滚动效果
2020/05/28 Javascript
js实现缓动动画
2020/11/25 Javascript
Python MD5文件生成码
2009/01/12 Python
Python 备份程序代码实现
2017/03/06 Python
对web.py设置favicon.ico的方法详解
2018/12/04 Python
给我一面国旗 python帮你实现
2019/09/30 Python
毕业自我评价范文
2013/11/17 职场文书
合作协议书范本
2014/10/25 职场文书
工伤私了协议书范本
2014/11/24 职场文书
记者节感言
2015/08/03 职场文书
初一英语教学反思
2016/02/15 职场文书
了解Redis常见应用场景
2021/06/23 Redis
PHP中国际化的字符串排序和比较对象详解
2021/08/23 PHP
SQLyog的下载、安装、破解、配置教程(MySQL可视化工具安装)
2022/09/23 MySQL