python爬虫爬取图片的简单代码


Posted in Python onJanuary 18, 2021

Python是很好的爬虫工具不用再说了,它可以满足我们爬取网络内容的需求,那最简单的爬取网络上的图片,可以通过很简单的方法实现。只需导入正则表达式模块,并利用spider原理通过使用定义函数的方法可以轻松的实现爬取图片的需求。

1、spider原理

spider就是定义爬取的动作及分析网站的地方。
以初始的URL**初始化Request**,并设置回调函数。 当该request**下载完毕并返回时,将生成**response ,并作为参数传给该回调函数。

2、实现python爬虫爬取图片

第一步:导入正则表达式模块

import re # 导入正则表达式模块
import requests # python HTTP客户端 编写爬虫和测试服务器经常用到的模块
import random # 随机生成一个数,范围[0,1]

第二步:使用定义函数的方法爬取图片

def spiderPic(html, keyword):
  print('正在查找 ' + keyword + ' 对应的图片,下载中,请稍后......')
  for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL
    print('正在爬取URL地址:' + str(addr)[0:30] + '...') 
    # 爬取的地址长度超过30时,用'...'代替后面的内容
    try:
      pics = requests.get(addr, timeout=100) # 请求URL时间(最大10秒)
    except requests.exceptions.ConnectionError:
      print('您当前请求的URL地址出现错误')
      continue
    fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
     # 下载图片,并保存和命名
    fq.write(pics.content)
    fq.close()

到此这篇关于python爬虫爬取图片的简单代码的文章就介绍到这了,更多相关python爬虫怎么爬取图片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
pydev使用wxpython找不到路径的解决方法
Feb 10 Python
Python装饰器入门学习教程(九步学习)
Jan 28 Python
详解Python pygame安装过程笔记
Jun 05 Python
pycharm远程调试openstack代码
Nov 21 Python
python爬虫之自动登录与验证码识别
Jun 15 Python
Python 实现「食行生鲜」签到领积分功能
Sep 26 Python
python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例
Nov 28 Python
keras分类模型中的输入数据与标签的维度实例
Jul 03 Python
Python如何发送与接收大型数组
Aug 07 Python
Django返回HTML文件的实现方法
Sep 17 Python
python如何调用百度识图api
Sep 29 Python
python如何对链表操作
Oct 10 Python
python中用Scrapy实现定时爬虫的实例讲解
Jan 18 #Python
java关于string最常出现的面试题整理
Jan 18 #Python
python爬虫实现爬取同一个网站的多页数据的实例讲解
Jan 18 #Python
python中四舍五入的正确打开方式
Jan 18 #Python
PyQt5中QSpinBox计数器的实现
Jan 18 #Python
全网最细 Python 格式化输出用法讲解(推荐)
Jan 18 #Python
PyQt实现计数器的方法示例
Jan 18 #Python
You might like
MYSQL数据库初学者使用指南
2006/11/16 PHP
PHP和Shell实现检查SAMBA与NFS Server是否存在
2015/01/07 PHP
php is_executable判断给定文件名是否可执行实例
2016/09/26 PHP
javascript:以前写的xmlhttp池,代码
2008/05/18 Javascript
网页加载时页面显示进度条加载完成之后显示网页内容
2012/12/23 Javascript
jQuery动画animate方法使用介绍
2013/05/06 Javascript
javascript实现校验文件上传控件实例
2015/04/20 Javascript
jQuery短信验证倒计时功能实现方法详解
2016/05/25 Javascript
jQuery+正则+文本框只能输入数字的实现方法
2016/10/07 Javascript
nodejs基础知识
2017/02/03 NodeJs
JS实现简易刻度时钟示例代码
2017/03/11 Javascript
jquery中关于bind()方法的使用技巧分享
2017/03/30 jQuery
IE11下使用canvas.toDataURL报SecurityError错误的解决方法
2017/11/19 Javascript
jQuery实现验证表单密码一致性及正则表达式验证邮箱、手机号的方法
2017/12/05 jQuery
详解开发react应用最好用的脚手架 create-react-app
2018/04/24 Javascript
基于nodejs res.end和res.send的区别
2018/05/14 NodeJs
小程序实现图片预览裁剪插件
2019/11/22 Javascript
Vue实现验证码功能
2019/12/03 Javascript
JavaScript设计模式--简单工厂模式定义与应用案例详解
2020/05/23 Javascript
Python中处理unchecked未捕获异常实例
2015/01/17 Python
Python基于回溯法子集树模板解决0-1背包问题实例
2017/09/02 Python
pandas 按照特定顺序输出的实现代码
2018/07/10 Python
Python基于Tkinter模块实现的弹球小游戏
2018/12/27 Python
python文本数据处理学习笔记详解
2019/06/17 Python
python识别文字(基于tesseract)代码实例
2019/08/24 Python
python使用多线程编写tcp客户端程序
2019/09/02 Python
pytorch查看通道数 维数 尺寸大小方式
2020/05/26 Python
HTML5实时语音通话聊天MP3压缩传输3KB每秒
2019/08/28 HTML / CSS
简约控的天堂:The Undone
2016/12/21 全球购物
大学生学习生活的自我评价
2013/11/01 职场文书
广告学毕业生求职信
2014/01/30 职场文书
天鹅的故事教学反思
2014/02/04 职场文书
舞蹈教育学专业自荐信
2014/06/15 职场文书
小学社团活动总结
2014/06/27 职场文书
勤俭节约主题班会
2015/08/13 职场文书
Java实现二维数组和稀疏数组之间的转换
2021/06/27 Java/Android