python爬虫爬取图片的简单代码


Posted in Python onJanuary 18, 2021

Python是很好的爬虫工具不用再说了,它可以满足我们爬取网络内容的需求,那最简单的爬取网络上的图片,可以通过很简单的方法实现。只需导入正则表达式模块,并利用spider原理通过使用定义函数的方法可以轻松的实现爬取图片的需求。

1、spider原理

spider就是定义爬取的动作及分析网站的地方。
以初始的URL**初始化Request**,并设置回调函数。 当该request**下载完毕并返回时,将生成**response ,并作为参数传给该回调函数。

2、实现python爬虫爬取图片

第一步:导入正则表达式模块

import re # 导入正则表达式模块
import requests # python HTTP客户端 编写爬虫和测试服务器经常用到的模块
import random # 随机生成一个数,范围[0,1]

第二步:使用定义函数的方法爬取图片

def spiderPic(html, keyword):
  print('正在查找 ' + keyword + ' 对应的图片,下载中,请稍后......')
  for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL
    print('正在爬取URL地址:' + str(addr)[0:30] + '...') 
    # 爬取的地址长度超过30时,用'...'代替后面的内容
    try:
      pics = requests.get(addr, timeout=100) # 请求URL时间(最大10秒)
    except requests.exceptions.ConnectionError:
      print('您当前请求的URL地址出现错误')
      continue
    fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
     # 下载图片,并保存和命名
    fq.write(pics.content)
    fq.close()

到此这篇关于python爬虫爬取图片的简单代码的文章就介绍到这了,更多相关python爬虫怎么爬取图片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python工程师面试题 与Python基础语法相关
Jan 14 Python
Python实现中文数字转换为阿拉伯数字的方法示例
May 26 Python
pandas多级分组实现排序的方法
Apr 20 Python
详谈python3 numpy-loadtxt的编码问题
Apr 29 Python
Django Rest framework之权限的实现示例
Dec 17 Python
利用Python实现kNN算法的代码
Aug 16 Python
Python3从零开始搭建一个语音对话机器人的实现
Aug 23 Python
利用 Python ElementTree 生成 xml的实例
Mar 06 Python
Python基于模块Paramiko实现SSHv2协议
Apr 28 Python
Python连接Mysql进行增删改查的示例代码
Aug 03 Python
使用Python的开发框架Brownie部署以太坊智能合约
May 28 Python
Python中else的三种使用场景
Jun 16 Python
python中用Scrapy实现定时爬虫的实例讲解
Jan 18 #Python
java关于string最常出现的面试题整理
Jan 18 #Python
python爬虫实现爬取同一个网站的多页数据的实例讲解
Jan 18 #Python
python中四舍五入的正确打开方式
Jan 18 #Python
PyQt5中QSpinBox计数器的实现
Jan 18 #Python
全网最细 Python 格式化输出用法讲解(推荐)
Jan 18 #Python
PyQt实现计数器的方法示例
Jan 18 #Python
You might like
用js进行url编码后用php反解以及用php实现js的escape功能函数总结
2010/02/08 PHP
Laravel日志用法详解
2016/10/09 PHP
PHP实现对图片的反色处理功能【测试可用】
2018/02/01 PHP
PHP模版引擎原理、定义与用法实例
2019/03/29 PHP
php中错误处理操作实例分析
2019/08/23 PHP
javascript 图片上传预览-兼容标准
2009/06/01 Javascript
Javascript 作用域使用说明
2009/08/13 Javascript
google 搜索框添加关键字实现代码
2010/04/24 Javascript
JQuery给元素添加/删除节点比如select
2013/04/02 Javascript
Javascript Web Slider 焦点图示例源码
2013/10/10 Javascript
JS获取屏幕,浏览器窗口大小,网页高度宽度(实现代码)
2013/12/17 Javascript
jQuery表单域选择器用法分析
2015/02/10 Javascript
jQuery EasyUI datagrid实现本地分页的方法
2015/02/13 Javascript
DWR中各种java方法的调用
2016/05/04 Javascript
bootstrap fileinput完整实例分享
2016/11/08 Javascript
VUE中v-model和v-for指令详解
2017/06/23 Javascript
Bootstrap datepicker日期选择器插件使用详解
2017/07/26 Javascript
JS获取指定月份的天数两种实现方法
2018/06/22 Javascript
React中嵌套组件与被嵌套组件的通信过程
2018/07/11 Javascript
原生JS实现旋转轮播图+文字内容切换效果【附源码】
2018/09/29 Javascript
Vue 框架之动态绑定 css 样式实例分析
2018/11/14 Javascript
基于vue实现圆形菜单栏组件
2019/07/05 Javascript
vue打包npm run build时候界面报错的解决
2020/08/13 Javascript
Python实现mysql数据库更新表数据接口的功能
2017/11/19 Python
对json字符串与python字符串的不同之处详解
2018/12/19 Python
Python和Anaconda和Pycharm安装教程图文详解
2020/02/04 Python
k-means 聚类算法与Python实现代码
2020/06/01 Python
美国时尚女装在线:Missguided
2016/12/03 全球购物
上海方立数码笔试题
2013/10/18 面试题
会计大学生职业生涯规划书范文
2014/01/13 职场文书
央视元宵晚会主持串词
2014/03/25 职场文书
新年爱情寄语
2014/04/08 职场文书
大学学习计划书范文
2014/05/02 职场文书
超市理货员岗位职责
2014/07/04 职场文书
2015年大学生社会实践评语
2015/03/26 职场文书
蔬果开业典礼发言稿应该怎么写?
2019/09/03 职场文书