详解Python静态网页爬取获取高清壁纸


Posted in Python onApril 23, 2019

前言

在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤

一般地,我们去网上批量打开壁纸的时候一般操作如下:

1、打开壁纸网页

2、单击壁纸图(打开指定壁纸的页面)

3、选择分辨率(我们要下载高清的图)

4、保存图片

实际操作时,我们实现了如下几步网页地址的访问:打开了壁纸的网页→单击壁纸图打开指定页面→选择分辨率,点击后打开最终保存目标图片网页→保存图片

在爬虫的过程中我们就尝试通过模拟浏览器打开网页的操作,一步步获得、访问网页、最后获得目标图片的下载地址,对图片进行下载保存到指定路径中

*这些中间过程中网页的一些具体筛选条件的构造,需要打开指定页面的源代码去观察和寻找包含有目的链接的标签

具体实现项目与注释

这里我只想获得一些指定的图片,所以我先在网页上搜索“长门有希”,打开了一个搜索结果页面,发现在这个页面上就已经包含了同类型的其他壁纸链接,于是我一开始就把最初访问的目的地址设置为这个搜索结果页面

目标结果页面截图:

详解Python静态网页爬取获取高清壁纸

图中下标为"1/29"."2/29"为其他同类型目标壁纸,通过点击这些图片我们可以打开新的目标下载图片页面

这里我们查看一下网页源代码

详解Python静态网页爬取获取高清壁纸

图中黄色底的地方就是打开这些同类壁纸的目的地址(访问的时候需要加上前缀"http://desk.zol.com.cn")

现在我们可以尝试实现构建爬虫:

打开指定页面→筛选获得所有长门有希壁纸的目标下载页面链接

代码如下:

详解Python静态网页爬取获取高清壁纸

获得地址以后我们可以通过获取地址→打开指定页面→选择分辨率→获得目的下载地址→保存到本地指定路径中

在测试的时候我输出了一下上一步truelist中保存的内容

 详解Python静态网页爬取获取高清壁纸

可以看到保存的只是一个后缀,在访问的时候我们需要加上一个指定的前缀

实现代码如下(注释见代码):

详解Python静态网页爬取获取高清壁纸

 最后可以在自己的目标文件夹中看到爬下来的图片集~

详解Python静态网页爬取获取高清壁纸

以上所述是小编给大家介绍的Python爬取高清壁纸详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python获取apk文件URL地址实例
Nov 01 Python
python 爬虫出现403禁止访问错误详解
Mar 11 Python
python数据类型判断type与isinstance的区别实例解析
Oct 31 Python
python使用TensorFlow进行图像处理的方法
Feb 28 Python
django输出html内容的实例
May 27 Python
python写入并获取剪切板内容的实例
May 31 Python
Python基本socket通信控制操作示例
Jan 30 Python
python列表每个元素同增同减和列表元素去空格的实例
Jul 20 Python
python爬虫中多线程的使用详解
Sep 23 Python
python GUI库图形界面开发之PyQt5简单绘图板实例与代码分析
Mar 08 Python
Python如何自动获取目标网站最新通知
Jun 18 Python
Python3+selenium配置常见报错解决方案
Aug 28 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 #Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 #Python
详解Python 函数如何重载?
Apr 23 #Python
解决Django生产环境无法加载静态文件问题的解决
Apr 23 #Python
Python 存储字符串时节省空间的方法
Apr 23 #Python
Django页面数据的缓存与使用的具体方法
Apr 23 #Python
Python切片操作去除字符串首尾的空格
Apr 22 #Python
You might like
require(),include(),require_once()和include_once()区别
2008/03/27 PHP
10条PHP编程习惯助你找工作
2008/09/29 PHP
使用PHP获取网络文件的实现代码
2010/01/01 PHP
PHP中include()与require()的区别说明
2010/03/10 PHP
php max_execution_time执行时间问题
2011/07/17 PHP
ThinkPHP使用心得分享-分页类Page的用法
2014/05/15 PHP
非集成环境的php运行环境(Apache配置、Mysql)搭建安装图文教程
2016/04/12 PHP
在CentOS系统上从零开始搭建WordPress博客的全流程记录
2016/04/21 PHP
基于Laravel5.4实现多字段登录功能方法示例
2017/08/11 PHP
PHP获取数据库表中的数据插入新的表再原删除数据方法
2018/10/12 PHP
Laravel5.7 数据库操作迁移的实现方法
2019/04/12 PHP
php查看一个变量的占用内存的实例代码
2020/03/29 PHP
修改jquery里的dialog对话框插件为框架页(iframe) 的方法
2010/09/14 Javascript
jquery缓动swing liner控制动画过程不同时刻的速度
2014/05/29 Javascript
JavaScript实现常用二级省市级联下拉列表的方法
2015/03/25 Javascript
JavaScript获取指定元素位置的方法
2015/04/08 Javascript
使用three.js 画渐变的直线
2016/06/05 Javascript
jQuery Ajax 实现在html页面实时显示用户登录状态
2016/12/30 Javascript
基于Vue2.0+ElementUI实现表格翻页功能
2017/10/23 Javascript
微信小程序之判断页面滚动方向的示例代码
2018/08/30 Javascript
详解微信小程序支付流程与梳理
2019/07/16 Javascript
[01:14]TI珍贵瞬间系列(六):冠军
2020/08/30 DOTA
python实现监控linux性能及进程消耗性能的方法
2014/07/25 Python
Python安装使用命令行交互模块pexpect的基础教程
2016/05/12 Python
python 排序算法总结及实例详解
2016/09/28 Python
K-近邻算法的python实现代码分享
2017/12/09 Python
Pytorch - TORCH.NN.INIT 参数初始化的操作
2021/02/27 Python
HTML5获取当前地理位置并在百度地图上展示的实例
2020/07/10 HTML / CSS
使用layui实现左侧菜单栏及动态操作tab项的方法
2020/11/10 HTML / CSS
食堂员工工作职责
2013/12/18 职场文书
家长对孩子评语
2014/01/30 职场文书
人力资源管理专业自荐书范文
2014/02/10 职场文书
市场营销方案范文
2014/03/11 职场文书
因身体原因离职的辞职信范文
2015/05/12 职场文书
2016年领导干部廉政承诺书
2016/03/24 职场文书
小程序实现文字循环滚动动画
2021/06/14 Javascript