Python爬虫入门案例之回车桌面壁纸网美女图片采集


Posted in Python onOctober 16, 2021

知识点

  • requests
  • parsel
  • re
  • os

环境

  •  python3.8
  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

Python爬虫入门案例之回车桌面壁纸网美女图片采集

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求
  • 获取网页源代码
  • 提取想要的图片链接   css样式提取 xpath re正则表达式 bs4
  • 替换所有的图片链接 换成大图
  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requests
import parsel       # 第三方库 pip install parsel
import os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)
photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()
title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()
for photo_url, title in zip(photo_url_list, title_list):
    print(f'*****************正在爬取{title}*****************')
    response = requests.get(photo_url)
    # <Response [200]>: 请求成功的标识
    selector = parsel.Selector(response.text)
    # 提取想要的图片链接[第一个链接, 第二个链接,....]
    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()
    # 新建一个文件夹
    if not os.path.exists('img/' + title):
        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:
    # 字符串的替换
    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据content
img_data = requests.get(img_url).content
# 图片名称 字符串分割
# 分割完之后 会给我们返回一个列表
img_title = img_url.split('/')[-1]
with open(f'img/{title}/{img_title}', mode='wb') as f:
    f.write(img_data)
print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').text
counts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]
for page in range(1, int(counts) + 1):
    print(f'------------------------------------正在爬取第{page}页------------------------------------')
    发送网络请求
    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

Python爬虫入门案例之回车桌面壁纸网美女图片采集

到此这篇关于Python爬虫入门案例之回车桌面壁纸网美女图片采集的文章就介绍到这了,更多相关Python 图片采集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python统计文本文件内单词数量的方法
May 30 Python
Python爬虫爬验证码实现功能详解
Apr 14 Python
Python中%r和%s的详解及区别
Mar 16 Python
Python 模拟登陆的两种实现方法
Aug 10 Python
Python 比较两个数组的元素的异同方法
Aug 17 Python
python+ffmpeg视频并发直播压力测试
Mar 06 Python
Python实现的序列化和反序列化二叉树算法示例
Mar 02 Python
python实现银联支付和支付宝支付接入
May 07 Python
详解Django模版中加载静态文件配置方法
Jul 21 Python
新年福利来一波之Python轻松集齐五福(demo)
Jan 20 Python
PyTorch 如何设置随机数种子使结果可复现
May 12 Python
Python实现Excel文件的合并(以新冠疫情数据为例)
Mar 20 Python
Python Django模型详解
Python 阶乘详解
Oct 05 #Python
Python 实现Mac 屏幕截图详解
基于Python和openCV实现图像的全景拼接详细步骤
C3 线性化算法与 MRO之Python中的多继承
Python编程super应用场景及示例解析
Python编程源码报错解决方法总结经验分享
Oct 05 #Python
You might like
php简单静态页生成过程
2008/03/27 PHP
php中Snoopy类用法实例
2015/06/19 PHP
详解PHP中的mb_detect_encoding函数使用方法
2015/08/18 PHP
PHP实现的pdo连接数据库并插入数据功能简单示例
2019/03/30 PHP
PHP开发实现快递查询功能详解
2019/04/08 PHP
新页面打开实际尺寸的图片
2006/08/25 Javascript
jquery让返回的内容显示在特定div里(代码少而精悍)
2014/06/23 Javascript
js实现兼容IE、Firefox的图片缩放代码
2015/12/08 Javascript
全面解析Angular中$Apply()及$Digest()的区别
2016/08/04 Javascript
微信js-sdk分享功能接口常用逻辑封装示例
2016/10/13 Javascript
简单谈谈gulp-changed插件
2017/02/21 Javascript
js/jq仿window文件夹框选操作插件
2017/03/08 Javascript
jQuery插件HighCharts实现的2D对数饼图效果示例【附demo源码下载】
2017/03/09 Javascript
Jquery-data的三种用法
2017/04/18 jQuery
Vue 多层组件嵌套二种实现方式(测试实例)
2017/09/08 Javascript
修改UA在PC中访问只能在微信中打开的链接方法
2017/11/27 Javascript
记录一次开发微信网页分享的步骤
2019/05/07 Javascript
为nuxt项目写一个面包屑cli工具实现自动生成页面与面包屑配置
2019/09/29 Javascript
JQuery省市联动效果实现过程详解
2020/05/08 jQuery
[01:48]2018DOTA2亚洲邀请赛主赛事第二日五佳镜头 VG完美团战逆转TNC
2018/04/05 DOTA
一个计算身份证号码校验位的Python小程序
2014/08/15 Python
TensorFlow神经网络优化策略学习
2018/03/09 Python
使用python读取.text文件特定行的数据方法
2019/01/28 Python
Python socket模块ftp传输文件过程解析
2019/11/05 Python
new_zeros() pytorch版本的转换方式
2020/02/18 Python
在python中利用pycharm自定义代码块教程(三步搞定)
2020/04/15 Python
django 外键创建注意事项说明
2020/05/20 Python
实例代码讲解Python 线程池
2020/08/24 Python
Linux内核产生并发的原因
2016/11/08 面试题
成教自我鉴定
2013/10/27 职场文书
总经理工作职责范文
2014/03/14 职场文书
创建绿色社区汇报材料
2014/08/22 职场文书
群众路线表态发言材料
2014/10/17 职场文书
英文慰问信范文
2015/03/24 职场文书
MYSQL如何查看进程和kill进程
2022/03/13 MySQL
利用Apache Common将java对象池化的问题
2022/06/16 Servers