Python爬虫入门案例之回车桌面壁纸网美女图片采集


Posted in Python onOctober 16, 2021

知识点

  • requests
  • parsel
  • re
  • os

环境

  •  python3.8
  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

Python爬虫入门案例之回车桌面壁纸网美女图片采集

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求
  • 获取网页源代码
  • 提取想要的图片链接   css样式提取 xpath re正则表达式 bs4
  • 替换所有的图片链接 换成大图
  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requests
import parsel       # 第三方库 pip install parsel
import os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)
photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()
title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()
for photo_url, title in zip(photo_url_list, title_list):
    print(f'*****************正在爬取{title}*****************')
    response = requests.get(photo_url)
    # <Response [200]>: 请求成功的标识
    selector = parsel.Selector(response.text)
    # 提取想要的图片链接[第一个链接, 第二个链接,....]
    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()
    # 新建一个文件夹
    if not os.path.exists('img/' + title):
        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:
    # 字符串的替换
    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据content
img_data = requests.get(img_url).content
# 图片名称 字符串分割
# 分割完之后 会给我们返回一个列表
img_title = img_url.split('/')[-1]
with open(f'img/{title}/{img_title}', mode='wb') as f:
    f.write(img_data)
print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').text
counts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]
for page in range(1, int(counts) + 1):
    print(f'------------------------------------正在爬取第{page}页------------------------------------')
    发送网络请求
    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

到此这篇关于Python爬虫入门案例之回车桌面壁纸网美女图片采集的文章就介绍到这了,更多相关Python 图片采集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用Paramiko模块编写脚本进行远程服务器操作
May 05 Python
利用Python中SocketServer 实现客户端与服务器间非阻塞通信
Dec 15 Python
python dict 字典 以及 赋值 引用的一些实例(详解)
Jan 20 Python
在Python的一段程序中如何使用多次事件循环详解
Sep 07 Python
Python中字典的浅拷贝与深拷贝用法实例分析
Jan 02 Python
Django中使用Celery的教程详解
Aug 24 Python
python+selenium实现QQ邮箱自动发送功能
Jan 23 Python
Python利用lxml模块爬取豆瓣读书排行榜的方法与分析
Apr 15 Python
python 错误处理 assert详解
Apr 20 Python
利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)
Sep 04 Python
Python 下载Bing壁纸的示例
Sep 29 Python
Python 利用Entrez库筛选下载PubMed文献摘要的示例
Nov 24 Python
Python Django模型详解
Python 阶乘详解
Oct 05 #Python
Python 实现Mac 屏幕截图详解
基于Python和openCV实现图像的全景拼接详细步骤
C3 线性化算法与 MRO之Python中的多继承
Python编程super应用场景及示例解析
Python编程源码报错解决方法总结经验分享
Oct 05 #Python
You might like
SONY ICF-SW55的电路分析
2021/03/02 无线电
PHP学习之数组的定义和填充
2011/04/17 PHP
php用正则表达式匹配中文实例详解
2013/11/06 PHP
PHP使用array_merge重新排列数组下标的方法
2015/07/22 PHP
详解php语言最牛掰的Laravel框架
2017/11/20 PHP
JS动画效果代码3
2008/04/03 Javascript
js下利用控制器载入对应脚本
2010/07/17 Javascript
Jquery优化效率 提升性能解决方案
2010/09/06 Javascript
使用jQuery实现的掷色子游戏动画效果
2014/03/14 Javascript
js Object2String方便查看js对象内容
2014/11/24 Javascript
Vue2.x中的父子组件相互通信的实现方法
2017/05/02 Javascript
angular2模块和共享模块详解
2018/04/08 Javascript
NodeJS安装图文教程
2018/04/19 NodeJs
vue项目使用axios发送请求让ajax请求头部携带cookie的方法
2018/09/26 Javascript
Vue组件系列开发之模态框
2019/04/18 Javascript
微信小程序调用微信支付接口的实现方法
2019/04/29 Javascript
微信小程序非跳转式组件授权登录的方法示例
2019/05/22 Javascript
bootstrap table实现横向合并与纵向合并
2019/07/18 Javascript
JavaScript如何借用构造函数继承
2019/11/06 Javascript
layui实现显示数据表格、搜索和修改功能示例
2020/06/03 Javascript
[54:10]完美世界DOTA2联赛PWL S2 Magma vs FTD 第二场 11.29
2020/12/03 DOTA
python开发利器之ulipad的使用实践
2017/03/16 Python
Python实现调度算法代码详解
2017/12/01 Python
Python列表list排列组合操作示例
2018/12/18 Python
django admin组件使用方法详解
2019/07/19 Python
django中使用POST方法获取POST数据
2019/08/20 Python
举例详解CSS3中的Transition
2015/07/15 HTML / CSS
使用CSS3的font-face字体嵌入样式的方法讲解
2016/05/13 HTML / CSS
全球领先的鞋类零售商:The Walking Company
2016/07/21 全球购物
英国最大的体育&时尚零售公司:JD Sports
2017/12/13 全球购物
意大利值得信赖的在线超级药房:PillolaStore
2020/02/05 全球购物
食品安全工作方案
2014/05/07 职场文书
2015年幼儿园国庆节活动总结
2015/07/30 职场文书
运动会广播稿200字
2015/08/19 职场文书
创业的9条正确思考方式
2019/08/26 职场文书
python三子棋游戏
2022/05/04 Python