Python爬虫入门案例之回车桌面壁纸网美女图片采集


Posted in Python onOctober 16, 2021

知识点

  • requests
  • parsel
  • re
  • os

环境

  •  python3.8
  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

Python爬虫入门案例之回车桌面壁纸网美女图片采集

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求
  • 获取网页源代码
  • 提取想要的图片链接   css样式提取 xpath re正则表达式 bs4
  • 替换所有的图片链接 换成大图
  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requests
import parsel       # 第三方库 pip install parsel
import os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)
photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()
title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()
for photo_url, title in zip(photo_url_list, title_list):
    print(f'*****************正在爬取{title}*****************')
    response = requests.get(photo_url)
    # <Response [200]>: 请求成功的标识
    selector = parsel.Selector(response.text)
    # 提取想要的图片链接[第一个链接, 第二个链接,....]
    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()
    # 新建一个文件夹
    if not os.path.exists('img/' + title):
        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:
    # 字符串的替换
    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据content
img_data = requests.get(img_url).content
# 图片名称 字符串分割
# 分割完之后 会给我们返回一个列表
img_title = img_url.split('/')[-1]
with open(f'img/{title}/{img_title}', mode='wb') as f:
    f.write(img_data)
print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').text
counts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]
for page in range(1, int(counts) + 1):
    print(f'------------------------------------正在爬取第{page}页------------------------------------')
    发送网络请求
    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

到此这篇关于Python爬虫入门案例之回车桌面壁纸网美女图片采集的文章就介绍到这了,更多相关Python 图片采集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python升级提示Tkinter模块找不到的解决方法
Aug 22 Python
基于python的Tkinter实现一个简易计算器
Dec 31 Python
在Python程序员面试中被问的最多的10道题
Dec 05 Python
利用nohup来开启python文件的方法
Jan 14 Python
Python字典对象实现原理详解
Jul 01 Python
在python中画正态分布图像的实例
Jul 08 Python
PYTHON如何读取和写入EXCEL里面的数据
Oct 28 Python
Python zip函数打包元素实例解析
Dec 11 Python
简单了解Java Netty Reactor三种线程模型
Apr 26 Python
python 写一个文件分发小程序
Dec 05 Python
python scipy 稀疏矩阵的使用说明
May 26 Python
Python Matplotlib绘制两个Y轴图像
Apr 13 Python
Python Django模型详解
Python 阶乘详解
Oct 05 #Python
Python 实现Mac 屏幕截图详解
基于Python和openCV实现图像的全景拼接详细步骤
C3 线性化算法与 MRO之Python中的多继承
Python编程super应用场景及示例解析
Python编程源码报错解决方法总结经验分享
Oct 05 #Python
You might like
从MySQL数据库表中取出随机数据的代码
2007/09/05 PHP
PHP写杨辉三角实例代码
2011/07/17 PHP
php中使用addslashes函数报错问题的解决方法
2013/02/06 PHP
Zend Guard使用指南及问题处理
2015/01/07 PHP
PHP针对JSON操作实例分析
2015/01/12 PHP
php银联网页支付实现方法
2015/03/04 PHP
PHP根据key删除数组中指定的元素
2019/02/28 PHP
PHP实现八皇后算法
2019/05/06 PHP
Javascript 构造函数,公有,私有特权和静态成员定义方法
2009/11/30 Javascript
javascript 获取页面的高度及滚动条的位置的代码
2010/05/06 Javascript
javascript 实现键盘上下左右功能的小例子
2013/09/15 Javascript
javascript如何使用bind指定接收者
2014/05/04 Javascript
JavaScript的arguments对象应用示例
2014/09/15 Javascript
JS解析XML实例分析
2015/01/30 Javascript
jQuery插件zepto.js简单实现tab切换
2015/06/16 Javascript
JavaScript+html5 canvas绘制缤纷多彩的三角形效果完整实例
2016/01/26 Javascript
JS实现控制文本框的内容
2016/07/10 Javascript
js控制文本框只能输入中文、英文、数字与指定特殊符号的实现代码
2016/09/09 Javascript
JS定时检测任务任务完成后执行下一步的解决办法
2016/12/22 Javascript
node.js爬虫爬取拉勾网职位信息
2017/03/14 Javascript
JS中SetTimeout和SetInterval使用初探
2017/03/23 Javascript
JavaScript实现自动跳转文本功能
2017/05/25 Javascript
JavaScript异步上传图片文件的实例代码
2017/07/04 Javascript
countUp.js实现数字动态变化效果
2019/10/17 Javascript
vue 遮罩层阻止默认滚动事件操作
2020/07/28 Javascript
Python高效编程技巧
2013/01/07 Python
编程语言Python的发展史
2014/09/26 Python
Python 稀疏矩阵-sparse 存储和转换
2017/05/27 Python
如何基于python对接钉钉并获取access_token
2020/04/21 Python
美国木工工具和用品商店:Woodcraft
2019/10/30 全球购物
八年级英语教学反思
2014/01/09 职场文书
护士长竞聘书
2014/03/31 职场文书
体育专业大学生职业生涯规划范文:打造自己的运动帝国
2014/09/12 职场文书
2015年助残日活动总结
2015/03/27 职场文书
检讨书之工作不认真
2019/08/14 职场文书
面试官问我Mysql的存储引擎了解多少
2022/08/05 MySQL