详解Python静态网页爬取获取高清壁纸


Posted in Python onApril 23, 2019

前言

在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤

一般地,我们去网上批量打开壁纸的时候一般操作如下:

1、打开壁纸网页

2、单击壁纸图(打开指定壁纸的页面)

3、选择分辨率(我们要下载高清的图)

4、保存图片

实际操作时,我们实现了如下几步网页地址的访问:打开了壁纸的网页→单击壁纸图打开指定页面→选择分辨率,点击后打开最终保存目标图片网页→保存图片

在爬虫的过程中我们就尝试通过模拟浏览器打开网页的操作,一步步获得、访问网页、最后获得目标图片的下载地址,对图片进行下载保存到指定路径中

*这些中间过程中网页的一些具体筛选条件的构造,需要打开指定页面的源代码去观察和寻找包含有目的链接的标签

具体实现项目与注释

这里我只想获得一些指定的图片,所以我先在网页上搜索“长门有希”,打开了一个搜索结果页面,发现在这个页面上就已经包含了同类型的其他壁纸链接,于是我一开始就把最初访问的目的地址设置为这个搜索结果页面

目标结果页面截图:

详解Python静态网页爬取获取高清壁纸

图中下标为"1/29"."2/29"为其他同类型目标壁纸,通过点击这些图片我们可以打开新的目标下载图片页面

这里我们查看一下网页源代码

详解Python静态网页爬取获取高清壁纸

图中黄色底的地方就是打开这些同类壁纸的目的地址(访问的时候需要加上前缀"http://desk.zol.com.cn")

现在我们可以尝试实现构建爬虫:

打开指定页面→筛选获得所有长门有希壁纸的目标下载页面链接

代码如下:

详解Python静态网页爬取获取高清壁纸

获得地址以后我们可以通过获取地址→打开指定页面→选择分辨率→获得目的下载地址→保存到本地指定路径中

在测试的时候我输出了一下上一步truelist中保存的内容

 详解Python静态网页爬取获取高清壁纸

可以看到保存的只是一个后缀,在访问的时候我们需要加上一个指定的前缀

实现代码如下(注释见代码):

详解Python静态网页爬取获取高清壁纸

 最后可以在自己的目标文件夹中看到爬下来的图片集~

详解Python静态网页爬取获取高清壁纸

以上所述是小编给大家介绍的Python爬取高清壁纸详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python3读取zip文件信息的方法
May 22 Python
Python的time模块中的常用方法整理
Jun 18 Python
python使用电子邮件模块smtplib的方法
Aug 28 Python
详解python 发送邮件实例代码
Dec 22 Python
Python实现在线音乐播放器
Mar 03 Python
Python读取文件内容的三种常用方式及效率比较
Oct 07 Python
python实现Decorator模式实例代码
Feb 09 Python
Python 中字符串拼接的多种方法
Jul 30 Python
python定位xpath 节点位置的方法
Aug 27 Python
Python中生成一个指定长度的随机字符串实现示例
Nov 06 Python
Python 解析库json及jsonpath pickle的实现
Aug 17 Python
python如何做代码性能分析
Apr 26 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 #Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 #Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
You might like
php smarty截取中文字符乱码问题?gb2312/utf-8
2011/11/07 PHP
php获取客户端电脑屏幕参数的方法
2015/01/09 PHP
PHP环境中Memcache的安装和使用
2015/11/05 PHP
利用PHP自动生成印有用户信息的名片
2016/08/01 PHP
解决laravel5.4下的group by报错的问题
2019/10/16 PHP
Avengerls vs Newbee BO3 第三场2.18
2021/03/10 DOTA
javascript写的一个链表实现代码
2009/10/25 Javascript
a标签click和href执行顺序探讨
2014/06/23 Javascript
javascript实现带节日和农历的日历特效
2015/02/01 Javascript
jQuery实现为图片添加镜头放大效果的方法
2015/06/25 Javascript
angularjs学习笔记之完整的项目结构
2015/09/26 Javascript
javascript实现动态标签云
2015/10/16 Javascript
javascript基础语法学习笔记
2016/01/04 Javascript
JS实现倒计时(天数、时、分、秒)
2016/11/16 Javascript
canvas绘制七巧板
2017/02/03 Javascript
Bootstrap组件之下拉菜单,多级菜单及按钮布局方法实例
2017/05/25 Javascript
详解Angular CLI + Electron 开发环境搭建
2017/07/20 Javascript
JS随机排序数组实现方法分析
2017/10/11 Javascript
从零开始学习搭建React脚手架项目
2018/08/23 Javascript
javascript 原型与原型链的理解及实例分析
2019/11/23 Javascript
vue实现短信验证码登录功能(流程详解)
2019/12/10 Javascript
微信小程序实现导航栏和内容上下联动功能代码
2020/06/29 Javascript
[46:47]完美世界DOTA2联赛PWL S2 FTD vs Magma 第二场 11.20
2020/11/23 DOTA
Python中的MongoDB基本操作:连接、查询实例
2015/02/13 Python
Python编程中运用闭包时所需要注意的一些地方
2015/05/02 Python
python训练数据时打乱训练数据与标签的两种方法小结
2018/11/08 Python
解决python彩色螺旋线绘制引发的问题
2019/11/23 Python
python使用正则来处理各种匹配问题
2019/12/22 Python
如何基于Django实现上下文章跳转
2020/09/16 Python
PyQt5的QWebEngineView使用示例
2020/10/20 Python
英国DIY和家居装饰领域的主要品牌:Wickes
2019/11/26 全球购物
公共事业管理本科生求职信
2013/10/07 职场文书
运动会通讯稿500字
2014/02/20 职场文书
乡镇防汛工作汇报
2014/10/28 职场文书
干部作风建设工作总结
2014/10/29 职场文书
企业承诺书格式范文
2015/04/28 职场文书