Python爬虫入门案例之回车桌面壁纸网美女图片采集


Posted in Python onOctober 16, 2021

知识点

  • requests
  • parsel
  • re
  • os

环境

  •  python3.8
  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

Python爬虫入门案例之回车桌面壁纸网美女图片采集

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求
  • 获取网页源代码
  • 提取想要的图片链接   css样式提取 xpath re正则表达式 bs4
  • 替换所有的图片链接 换成大图
  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requests
import parsel       # 第三方库 pip install parsel
import os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)
photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()
title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()
for photo_url, title in zip(photo_url_list, title_list):
    print(f'*****************正在爬取{title}*****************')
    response = requests.get(photo_url)
    # <Response [200]>: 请求成功的标识
    selector = parsel.Selector(response.text)
    # 提取想要的图片链接[第一个链接, 第二个链接,....]
    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()
    # 新建一个文件夹
    if not os.path.exists('img/' + title):
        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:
    # 字符串的替换
    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据content
img_data = requests.get(img_url).content
# 图片名称 字符串分割
# 分割完之后 会给我们返回一个列表
img_title = img_url.split('/')[-1]
with open(f'img/{title}/{img_title}', mode='wb') as f:
    f.write(img_data)
print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').text
counts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]
for page in range(1, int(counts) + 1):
    print(f'------------------------------------正在爬取第{page}页------------------------------------')
    发送网络请求
    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

到此这篇关于Python爬虫入门案例之回车桌面壁纸网美女图片采集的文章就介绍到这了,更多相关Python 图片采集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python数据类型详解(四)字典:dict
May 12 Python
Python分治法定义与应用实例详解
Jul 28 Python
Python 给某个文件名添加时间戳的方法
Oct 16 Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 Python
python3 pygame实现接小球游戏
May 14 Python
python绘制已知点的坐标的直线实例
Jul 04 Python
使用Python实现文字转语音并生成wav文件的例子
Aug 08 Python
解决Django响应JsonResponse返回json格式数据报错问题
Aug 09 Python
python使用多线程查询数据库的实现示例
Aug 17 Python
手把手教你将Flask应用封装成Docker服务的实现
Aug 19 Python
如何利用Python写个坦克大战
Nov 18 Python
python元组拆包实现方法
Feb 28 Python
Python Django模型详解
Python 阶乘详解
Oct 05 #Python
Python 实现Mac 屏幕截图详解
基于Python和openCV实现图像的全景拼接详细步骤
C3 线性化算法与 MRO之Python中的多继承
Python编程super应用场景及示例解析
Python编程源码报错解决方法总结经验分享
Oct 05 #Python
You might like
ob_start(),ob_start('ob_gzhandler')使用
2006/12/25 PHP
Yii2超好用的日期和时间组件(值得收藏)
2016/05/05 PHP
php 中奖概率算法实现代码
2017/01/25 PHP
基于php(Thinkphp)+jquery 实现ajax多选反选不选删除数据功能
2017/02/24 PHP
PHP实现统计所有字符在字符串中出现次数的方法
2017/10/17 PHP
php7 参数、整形及字符串处理机制修改实例分析
2020/05/25 PHP
jQuery Lightbox 图片展示插件使用说明
2010/04/25 Javascript
jQuery的控件及事件(输入控件及回车事件)使用示例
2013/07/25 Javascript
Javascript中对象继承的实现小例
2014/05/12 Javascript
教你如何使用node.js制作代理服务器
2014/11/26 Javascript
浅谈JavaScript事件的属性列表
2015/03/01 Javascript
谈谈基于iframe、FormData、FileReader三种无刷新上传文件的方法
2015/12/03 Javascript
javascript中eval解析JSON字符串
2016/02/27 Javascript
js实现华丽的九九乘法表效果
2017/03/29 Javascript
使用jQuery和ajax代替iframe的方法(详解)
2017/04/12 jQuery
详解Angular2 关于*ngFor 嵌套循环
2017/05/22 Javascript
你应该知道的几类npm依赖包管理详解
2017/10/06 Javascript
JS与jQuery判断文本框还剩多少字符可以输入的方法
2018/09/01 jQuery
详解vue父子组件关于模态框状态的绑定方案
2019/06/05 Javascript
jQuery+ajax实现批量删除功能完整示例
2019/06/06 jQuery
nodejs一个简单的文件服务器的创建方法
2019/09/13 NodeJs
微信小程序本地存储实现每日签到、连续签到功能
2019/10/09 Javascript
小程序选项卡以及swiper套用(跨页面)
2020/06/19 Javascript
使用beaker让Facebook的Bottle框架支持session功能
2015/04/23 Python
Python脚本实现自动将数据库备份到 Dropbox
2017/02/06 Python
python3之模块psutil系统性能信息使用
2018/05/30 Python
python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片)
2019/08/06 Python
基于python监控程序是否关闭
2020/01/14 Python
毕业生机械建模求职信
2013/10/14 职场文书
技术人员面试提纲
2013/11/28 职场文书
就业自荐书
2013/12/05 职场文书
上课说话检讨书大全
2014/01/22 职场文书
离婚财产处理协议书
2014/09/30 职场文书
职代会闭幕词
2015/01/28 职场文书
云冈石窟导游词
2015/02/04 职场文书
关于战胜挫折的名言警句大全!
2019/07/05 职场文书