Python爬虫入门案例之回车桌面壁纸网美女图片采集


Posted in Python onOctober 16, 2021

知识点

  • requests
  • parsel
  • re
  • os

环境

  •  python3.8
  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

Python爬虫入门案例之回车桌面壁纸网美女图片采集

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求
  • 获取网页源代码
  • 提取想要的图片链接   css样式提取 xpath re正则表达式 bs4
  • 替换所有的图片链接 换成大图
  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requests
import parsel       # 第三方库 pip install parsel
import os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)
photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()
title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()
for photo_url, title in zip(photo_url_list, title_list):
    print(f'*****************正在爬取{title}*****************')
    response = requests.get(photo_url)
    # <Response [200]>: 请求成功的标识
    selector = parsel.Selector(response.text)
    # 提取想要的图片链接[第一个链接, 第二个链接,....]
    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()
    # 新建一个文件夹
    if not os.path.exists('img/' + title):
        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:
    # 字符串的替换
    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据content
img_data = requests.get(img_url).content
# 图片名称 字符串分割
# 分割完之后 会给我们返回一个列表
img_title = img_url.split('/')[-1]
with open(f'img/{title}/{img_title}', mode='wb') as f:
    f.write(img_data)
print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').text
counts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]
for page in range(1, int(counts) + 1):
    print(f'------------------------------------正在爬取第{page}页------------------------------------')
    发送网络请求
    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

到此这篇关于Python爬虫入门案例之回车桌面壁纸网美女图片采集的文章就介绍到这了,更多相关Python 图片采集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 字典(dict)遍历的四种方法性能测试报告
Jun 25 Python
Python3中多线程编程的队列运作示例
Apr 16 Python
Python模拟用户登录验证
Sep 11 Python
Python3.6基于正则实现的计算器示例【无优化简单注释版】
Jun 14 Python
python使用turtle库绘制时钟
Mar 25 Python
面向初学者的Python编辑器Mu
Oct 08 Python
python得到windows自启动列表的方法
Oct 14 Python
python使用pygame模块实现坦克大战游戏
Mar 25 Python
python 子类调用父类的构造函数实例
Mar 12 Python
Python类中的装饰器在当前类中的声明与调用详解
Apr 15 Python
Python基础之元组与文件知识总结
May 19 Python
Python&Matlab实现灰狼优化算法的示例代码
Mar 21 Python
Python Django模型详解
Python 阶乘详解
Oct 05 #Python
Python 实现Mac 屏幕截图详解
基于Python和openCV实现图像的全景拼接详细步骤
C3 线性化算法与 MRO之Python中的多继承
Python编程super应用场景及示例解析
Python编程源码报错解决方法总结经验分享
Oct 05 #Python
You might like
php中ob(Output Buffer 输出缓冲)函数使用方法
2007/07/21 PHP
php通过ajax实现双击table修改内容
2014/04/28 PHP
PHP微信公众号自动发送红包API
2016/06/01 PHP
载入进度条 效果
2006/07/08 Javascript
JQuery一种取同级值的方式(比如你在GridView中)
2012/03/15 Javascript
JavaScript执行效率与性能提升方案
2012/12/21 Javascript
常见的原始JS选择器使用方法总结
2014/04/09 Javascript
js超时调用setTimeout和间歇调用setInterval实例分析
2015/01/28 Javascript
jQuery插件EnPlaceholder实现输入框提示文字
2015/06/05 Javascript
JS Ajax请求如何防止重复提交
2016/06/13 Javascript
vue.js实现请求数据的方法示例
2017/02/07 Javascript
ES6函数实现排它两种写法解析
2020/05/13 Javascript
vue data有值,但是页面{{}} 取不到值的解决
2020/11/09 Javascript
[01:27:30]LGD vs Newbee 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/19 DOTA
浅析Python中的多条件排序实现
2016/06/07 Python
Python实现简单网页图片抓取完整代码实例
2017/12/15 Python
Python实现获取邮箱内容并解析的方法示例
2018/06/16 Python
Python从使用线程到使用async/await的深入讲解
2018/09/16 Python
pyinstaller打包单个exe后无法执行错误的解决方法
2019/06/21 Python
django框架事务处理小结【ORM 事务及raw sql,customize sql 事务处理】
2019/06/27 Python
django foreignkey(外键)的实现
2019/07/29 Python
基于Pycharm加载多个项目过程图解
2020/01/19 Python
python GUI库图形界面开发之PyQt5窗口控件QWidget详细使用方法
2020/02/26 Python
python代码如何注释
2020/06/01 Python
python如何设置静态变量
2020/09/07 Python
python语言实现贪吃蛇游戏
2020/11/13 Python
Hammitt官网:设计师手袋
2020/05/23 全球购物
百度JavaScript笔试题
2015/01/15 面试题
《凡卡》教学反思
2014/04/09 职场文书
幽默自我介绍演讲稿
2014/08/21 职场文书
新颖的化妆品活动方案
2014/08/21 职场文书
2014年保卫部工作总结
2014/11/21 职场文书
大班上学期个人总结
2015/02/13 职场文书
2016十一国庆节慰问信
2015/12/01 职场文书
MySQL 如何设计统计数据表
2021/06/15 MySQL
Python+Selenium实现读取网易邮箱验证码
2022/03/13 Python