详解Python静态网页爬取获取高清壁纸


Posted in Python onApril 23, 2019

前言

在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤

一般地,我们去网上批量打开壁纸的时候一般操作如下:

1、打开壁纸网页

2、单击壁纸图(打开指定壁纸的页面)

3、选择分辨率(我们要下载高清的图)

4、保存图片

实际操作时,我们实现了如下几步网页地址的访问:打开了壁纸的网页→单击壁纸图打开指定页面→选择分辨率,点击后打开最终保存目标图片网页→保存图片

在爬虫的过程中我们就尝试通过模拟浏览器打开网页的操作,一步步获得、访问网页、最后获得目标图片的下载地址,对图片进行下载保存到指定路径中

*这些中间过程中网页的一些具体筛选条件的构造,需要打开指定页面的源代码去观察和寻找包含有目的链接的标签

具体实现项目与注释

这里我只想获得一些指定的图片,所以我先在网页上搜索“长门有希”,打开了一个搜索结果页面,发现在这个页面上就已经包含了同类型的其他壁纸链接,于是我一开始就把最初访问的目的地址设置为这个搜索结果页面

目标结果页面截图:

详解Python静态网页爬取获取高清壁纸

图中下标为"1/29"."2/29"为其他同类型目标壁纸,通过点击这些图片我们可以打开新的目标下载图片页面

这里我们查看一下网页源代码

详解Python静态网页爬取获取高清壁纸

图中黄色底的地方就是打开这些同类壁纸的目的地址(访问的时候需要加上前缀"http://desk.zol.com.cn")

现在我们可以尝试实现构建爬虫:

打开指定页面→筛选获得所有长门有希壁纸的目标下载页面链接

代码如下:

详解Python静态网页爬取获取高清壁纸

获得地址以后我们可以通过获取地址→打开指定页面→选择分辨率→获得目的下载地址→保存到本地指定路径中

在测试的时候我输出了一下上一步truelist中保存的内容

 详解Python静态网页爬取获取高清壁纸

可以看到保存的只是一个后缀,在访问的时候我们需要加上一个指定的前缀

实现代码如下(注释见代码):

详解Python静态网页爬取获取高清壁纸

 最后可以在自己的目标文件夹中看到爬下来的图片集~

详解Python静态网页爬取获取高清壁纸

以上所述是小编给大家介绍的Python爬取高清壁纸详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python 正则表达式操作指南
May 04 Python
使用python将mdb数据库文件导入postgresql数据库示例
Feb 17 Python
python提取页面内url列表的方法
May 25 Python
python实现发送和获取手机短信验证码
Jan 15 Python
python脚本爬取字体文件的实现方法
Apr 29 Python
Python列表list内建函数用法实例分析【insert、remove、index、pop等】
Jul 24 Python
python zip()函数使用方法解析
Oct 31 Python
Python 内置变量和函数的查看及说明介绍
Dec 25 Python
python通过安装itchat包实现微信自动回复收到的春节祝福
Jan 19 Python
python实现将两个文件夹合并至另一个文件夹(制作数据集)
Apr 03 Python
python 检测nginx服务邮件报警的脚本
Dec 31 Python
python中封包建立过程实例
Feb 18 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 #Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 #Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
You might like
PHP memcache扩展的三种安装方法
2009/04/26 PHP
UCenter Home二次开发指南
2009/05/28 PHP
php常用ODBC函数集(详细)
2013/06/24 PHP
Yii框架数据库查询、增加、删除操作示例
2019/10/14 PHP
jquery 表单取值常用代码
2009/12/22 Javascript
JavaScript 保存数组到Cookie的代码
2010/04/14 Javascript
Javascript浅谈之this
2013/12/17 Javascript
当达到输入长度时表单自动切换焦点
2014/04/06 Javascript
深入解析jQuery中Deferred的deferred.promise()方法
2016/05/03 Javascript
修改jquery中dialog的title属性方法(推荐)
2016/08/26 Javascript
seajs学习之模块的依赖加载及模块API的导出
2016/10/20 Javascript
jQuery模拟实现的select点击选择效果【附demo源码下载】
2016/11/09 Javascript
input框中自动展示当前日期yyyy/mm/dd的实现方法
2017/07/06 Javascript
利用JS如何计算字符串所占字节数示例代码
2017/09/13 Javascript
JavaScript学习总结(一) ECMAScript、BOM、DOM(核心、浏览器对象模型与文档对象模型)
2018/01/07 Javascript
简单说说angular.json文件的使用
2018/10/29 Javascript
微信小程序自定义带价格显示日历效果
2018/12/29 Javascript
微信小程序通过js实现瀑布流布局详解
2019/08/28 Javascript
解决Layui当中的导航条动态添加后渲染失败的问题
2019/09/25 Javascript
Node快速切换版本、版本回退(降级)、版本更新(升级)
2021/01/07 Javascript
Python闭包实现计数器的方法
2015/05/05 Python
Python学习笔记之if语句的使用示例
2017/10/23 Python
python Tkinter版学生管理系统
2019/02/20 Python
搞清楚 Python traceback的具体使用方法
2019/05/13 Python
Python爬虫抓取技术的一些经验
2019/07/12 Python
python对常见数据类型的遍历解析
2019/08/27 Python
tensorflow 自定义损失函数示例代码
2020/02/05 Python
通过实例解析python and和or使用方法
2020/11/14 Python
Hawes & Curtis澳大利亚官网:英国经典服饰品牌
2018/10/29 全球购物
爱尔兰电脑、家电和家具购物网站:Buy It Direct
2019/07/09 全球购物
澳大利亚手袋、珠宝和在线时尚精品店:The Way
2019/12/21 全球购物
当一个对象被当作参数传递到一个方法后,此方法可改变这个对象的属性,并可返回变化后的结果,那么这里到底是值传递还是引用传递?
2014/09/09 面试题
成考报名单位证明范本
2014/01/16 职场文书
行政专员岗位职责说明书
2014/07/30 职场文书
学校领导班子对照检查材料
2014/08/28 职场文书
尊师重教主题班会
2015/08/14 职场文书