详解Python静态网页爬取获取高清壁纸


Posted in Python onApril 23, 2019

前言

在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤

一般地,我们去网上批量打开壁纸的时候一般操作如下:

1、打开壁纸网页

2、单击壁纸图(打开指定壁纸的页面)

3、选择分辨率(我们要下载高清的图)

4、保存图片

实际操作时,我们实现了如下几步网页地址的访问:打开了壁纸的网页→单击壁纸图打开指定页面→选择分辨率,点击后打开最终保存目标图片网页→保存图片

在爬虫的过程中我们就尝试通过模拟浏览器打开网页的操作,一步步获得、访问网页、最后获得目标图片的下载地址,对图片进行下载保存到指定路径中

*这些中间过程中网页的一些具体筛选条件的构造,需要打开指定页面的源代码去观察和寻找包含有目的链接的标签

具体实现项目与注释

这里我只想获得一些指定的图片,所以我先在网页上搜索“长门有希”,打开了一个搜索结果页面,发现在这个页面上就已经包含了同类型的其他壁纸链接,于是我一开始就把最初访问的目的地址设置为这个搜索结果页面

目标结果页面截图:

详解Python静态网页爬取获取高清壁纸

图中下标为"1/29"."2/29"为其他同类型目标壁纸,通过点击这些图片我们可以打开新的目标下载图片页面

这里我们查看一下网页源代码

详解Python静态网页爬取获取高清壁纸

图中黄色底的地方就是打开这些同类壁纸的目的地址(访问的时候需要加上前缀"http://desk.zol.com.cn")

现在我们可以尝试实现构建爬虫:

打开指定页面→筛选获得所有长门有希壁纸的目标下载页面链接

代码如下:

详解Python静态网页爬取获取高清壁纸

获得地址以后我们可以通过获取地址→打开指定页面→选择分辨率→获得目的下载地址→保存到本地指定路径中

在测试的时候我输出了一下上一步truelist中保存的内容

 详解Python静态网页爬取获取高清壁纸

可以看到保存的只是一个后缀,在访问的时候我们需要加上一个指定的前缀

实现代码如下(注释见代码):

详解Python静态网页爬取获取高清壁纸

 最后可以在自己的目标文件夹中看到爬下来的图片集~

详解Python静态网页爬取获取高清壁纸

以上所述是小编给大家介绍的Python爬取高清壁纸详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
从局部变量和全局变量开始全面解析Python中变量的作用域
Jun 16 Python
Python简单实现Base64编码和解码的方法
Apr 29 Python
python使用PIL模块获取图片像素点的方法
Jan 08 Python
用Python逐行分析文件方法
Jan 28 Python
Django的性能优化实现解析
Jul 30 Python
Python获取时间范围内日期列表和周列表的函数
Aug 05 Python
django将数组传递给前台模板的方法
Aug 06 Python
python基础教程之while循环
Aug 14 Python
jupyter notebook实现显示行号
Apr 13 Python
Python xlrd/xlwt 创建excel文件及常用操作
Sep 24 Python
Python中的None与 NULL(即空字符)的区别详解
Sep 24 Python
利用Python脚本写端口扫描器socket,python-nmap
Jul 23 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 #Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 #Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
You might like
一个php作的文本留言本的例子(五)
2006/10/09 PHP
php mssql 时间格式问题
2009/01/13 PHP
十幅图告诉你什么是PHP引用
2015/02/22 PHP
php通过获取头信息判断图片类型的方法
2015/06/26 PHP
微信支付开发发货通知实例
2016/07/12 PHP
thinkPHP3.2使用RBAC实现权限管理的实现
2019/08/27 PHP
PHP Web表单生成器案例分析
2020/06/02 PHP
JS刷新框架外页面七种实现代码
2013/02/18 Javascript
JS保留两位小数 四舍五入函数的小例子
2013/11/20 Javascript
Javascript selection的兼容性写法介绍
2013/12/20 Javascript
最新最热最实用的15个jQuery插件汇总
2015/07/05 Javascript
validationEngine 表单验证插件使用实例代码
2017/06/15 Javascript
详解mpvue小程序中怎么引入iconfont字体图标
2018/10/01 Javascript
vue cli 3.x 项目部署到 github pages的方法
2019/04/17 Javascript
解决layer.open后laydate失效的问题
2019/09/06 Javascript
在Python中用keys()方法返回字典键的教程
2015/05/21 Python
遗传算法之Python实现代码
2017/10/10 Python
Python探索之Metaclass初步了解
2017/10/28 Python
Python使用logging模块实现打印log到指定文件的方法
2018/09/05 Python
在 Linux/Mac 下为Python函数添加超时时间的方法
2020/02/20 Python
python使用selenium爬虫知乎的方法示例
2020/10/28 Python
python 制作简单的音乐播放器
2020/11/25 Python
matplotlib对象拾取事件处理的实现
2021/01/14 Python
购买限量版收藏品、珠宝和礼品:Bradford Exchange
2016/09/23 全球购物
俄罗斯第一家篮球店:StreetBall
2020/07/30 全球购物
人事代理委托书
2014/09/27 职场文书
个人批评与自我批评发言稿
2014/09/28 职场文书
单位接收函范文
2015/01/30 职场文书
2015年医德考评自我评价
2015/03/03 职场文书
2015年度优秀员工推荐信
2015/03/23 职场文书
企业内部管理控制:采购授权审批制度范本
2020/01/19 职场文书
关于vue中如何监听数组变化
2021/04/28 Vue.js
go语言使用Casbin实现角色的权限控制
2021/06/26 Golang
webpack的移动端适配方案小结
2021/07/25 Javascript
java代码实现空间切割
2022/01/18 Java/Android
Python OpenCV实现图像模板匹配详解
2022/04/07 Python