简单实现Python爬取网络图片


Posted in Python onApril 01, 2018

本文实例为大家分享了Python爬取网络图片的具体代码,供大家参考,具体内容如下

代码:

import urllib
import urllib.request
import re
#打开网页,下载器
def open_html ( url):
 require=urllib.request.Request(url)
 reponse=urllib.request.urlopen(require)
 html=reponse.read()
 return html
#下载图片
def load_image(html):
 regx='http://[\S]*jpg'
 pattern=re.compile(regx)
 get_image=re.findall(pattern,repr(html))

 num=1
 for img in get_image:
  photo=open_html(img)
  
  with open(r'E:\Photo\%s.jpg'%num,'wb') as f:
   print('开始下载图片')
   f.write(photo)
   print('正在下载第%s张图片'%num)
   f.close()
  num=num+1
 if num>1:
  print('下载成功!!!')
 else:
  print('下载失败!!!')

url='http://www.qiqipu.com/'
html=open_html(url)
load_image(html)

执行结果:

简单实现Python爬取网络图片

简单实现Python爬取网络图片

注意:

在运行之前,必须要有路径(文件夹):E:\Photo\

如果网站是HTTPS可以将正则中的http换为HTTPS,可以再定义一个下载图片的函数

如果想要下载jpg、png、gif等多种格式的图片可以将正则中的jpg换为对应格式,也可以使用元组定义多种格式后遍历

我这里只要jpg就可以,就不改了,大家可以自己改下。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pygame学习笔记(4):声音控制
Apr 15 Python
Python实现新浪博客备份的方法
Apr 27 Python
python实现字典(dict)和字符串(string)的相互转换方法
Mar 01 Python
解决python os.mkdir创建目录失败的问题
Oct 16 Python
Python向excel中写入数据的方法
May 05 Python
对Python的交互模式和直接运行.py文件的区别详解
Jun 29 Python
在django view中给form传入参数的例子
Jul 19 Python
python爬虫 正则表达式解析
Sep 28 Python
Pycharm远程连接服务器并实现代码同步上传更新功能
Feb 25 Python
python Zmail模块简介与使用示例
Dec 19 Python
Python爬虫入门案例之爬取二手房源数据
Oct 16 Python
浅析python中特殊文件和特殊函数
Feb 24 Python
Python中elasticsearch插入和更新数据的实现方法
Apr 01 #Python
python之DataFrame实现excel合并单元格
Feb 22 #Python
python合并同类型excel表格的方法
Apr 01 #Python
python实现两个文件合并功能
Apr 01 #Python
Python中一行和多行import模块问题
Apr 01 #Python
Python对List中的元素排序的方法
Apr 01 #Python
Python去除、替换字符串空格的处理方法
Apr 01 #Python
You might like
php中$_SERVER[PHP_SELF] 和 $_SERVER[SCRIPT_NAME]之间的区别
2009/09/05 PHP
PHP Zip解压 文件在线解压缩的函数代码
2010/05/26 PHP
一道关于php变量引用的面试题
2010/08/08 PHP
php中常用字符串处理代码片段整理
2011/11/07 PHP
jquery如何把参数列严格转换成数组实现思路
2013/04/01 Javascript
javascript刷新父页面的各种方法汇总
2014/09/03 Javascript
jQuery中parentsUntil()方法用法实例
2015/01/07 Javascript
javascript的switch用法注意事项分析
2015/02/02 Javascript
基于jQuery+Cookie实现的防止刷新的在线考试倒计时
2015/06/19 Javascript
js判断子窗体是否关闭的方法
2015/08/11 Javascript
jQuery版本升级踩坑大全
2016/01/12 Javascript
javascript封装addLoadEvent实现页面同时加载执行多个函数的方法
2016/07/25 Javascript
JS制作适用于手机和电脑的通知信息效果
2016/10/28 Javascript
ajax异步请求详解
2017/01/06 Javascript
vuejs响应用户事件(如点击事件)
2017/03/14 Javascript
jQuery轻松实现无缝轮播效果
2017/03/22 jQuery
JavaScript之Date_动力节点Java学院整理
2017/06/28 Javascript
vue中如何让子组件修改父组件数据
2018/06/14 Javascript
layui type2 通过url给iframe子页面传值的例子
2019/09/06 Javascript
js get和post请求实现代码解析
2020/02/06 Javascript
[04:53]DOTA2英雄基础教程 祈求者
2014/01/03 DOTA
python中django框架通过正则搜索页面上email地址的方法
2015/03/21 Python
python中的错误处理
2016/04/10 Python
Python 爬虫多线程详解及实例代码
2016/10/08 Python
python 循环读取txt文档 并转换成csv的方法
2018/10/26 Python
Python操作Excel工作簿的示例代码(\*.xlsx)
2020/03/23 Python
pytorch使用horovod多gpu训练的实现
2020/09/09 Python
提高python代码运行效率的一些建议
2020/09/29 Python
关于HTML5你必须知道的28个新特性,新技巧以及新技术
2012/05/28 HTML / CSS
英国剑桥包官网:The Cambridge Satchel Company
2016/08/01 全球购物
进程的查看和调度分别使用什么命令
2013/12/14 面试题
Ajax的优点和缺点
2014/11/21 面试题
三峡人家导游词
2015/01/31 职场文书
党员个人承诺书
2015/04/27 职场文书
员工福利申请报告
2015/05/15 职场文书
Nginx限流和黑名单配置
2022/05/20 Servers