Python3简单爬虫抓取网页图片代码实例


Posted in Python onAugust 26, 2019

现在网上有很多python2写的爬虫抓取网页图片的实例,但不适用新手(新手都使用python3环境,不兼容python2),

所以我用Python3的语法写了一个简单抓取网页图片的实例,希望能够帮助到大家,并希望大家批评指正。

import urllib.request
import re
import os
import urllib
#根据给定的网址来获取网页详细信息,得到的html就是网页的源代码 
def getHtml(url):
  page = urllib.request.urlopen(url)
  html = page.read()
  return html.decode('UTF-8')

def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址,放在imglist中
  x = 0
  path = 'D:\\test' 
  # 将图片保存到D:\\test文件夹中,如果没有test文件夹则创建
  if not os.path.isdir(path): 
    os.makedirs(path) 
  paths = path+'\\'   #保存在test路径下 

  for imgurl in imglist: 
    urllib.request.urlretrieve(imgurl,'{0}{1}.jpg'.format(paths,x)) #打开imglist中保存的图片网址,并下载图片保存在本地,format格式化字符串 
    x = x + 1 
  return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息,得到的html就是网页的源代码 
print (getImg(html)) #从网页源代码中分析并下载保存图片

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现查找系统盘中需要找的字符
Jul 14 Python
Python中subprocess的简单使用示例
Jul 28 Python
Python编码类型转换方法详解
Jul 01 Python
python非递归全排列实现方法
Apr 10 Python
Python实现简单的HttpServer服务器示例
Sep 25 Python
TensorFlow变量管理详解
Mar 10 Python
Python基于socket模块实现UDP通信功能示例
Apr 10 Python
Python中循环后使用list.append()数据被覆盖问题的解决
Jul 01 Python
python实现提取str字符串/json中多级目录下的某个值
Feb 27 Python
pyecharts调整图例与各板块的位置间距实例
May 16 Python
k-means 聚类算法与Python实现代码
Jun 01 Python
python如何更新包
Jun 11 Python
python 数据提取及拆分的实现代码
Aug 26 #Python
Python3 使用pillow库生成随机验证码
Aug 26 #Python
python excel转换csv代码实例
Aug 26 #Python
对YOLOv3模型调用时候的python接口详解
Aug 26 #Python
pandas条件组合筛选和按范围筛选的示例代码
Aug 26 #Python
python3 反射的四种基本方法解析
Aug 26 #Python
python接口调用已训练好的caffe模型测试分类方法
Aug 26 #Python
You might like
一个没有MYSQL数据库支持的简易留言本的编写
2006/10/09 PHP
PHP高效获取远程图片尺寸和大小的实现方法
2017/10/20 PHP
php操作mongodb封装类与用法实例
2018/09/01 PHP
超级强大的表单验证
2006/06/26 Javascript
使用js显示当前时间示例
2014/03/02 Javascript
js+css实现的圆角边框TAB选项卡滑动门代码分享(2款)
2015/08/26 Javascript
分享自己用JS做的扫雷小游戏
2016/02/17 Javascript
AngularJS基础 ng-selected 指令简单示例
2016/08/03 Javascript
ES6新特性之字符串的扩展实例分析
2017/04/01 Javascript
基于JS实现限时抢购倒计时间表代码
2017/05/09 Javascript
JS查找数组中重复元素的方法详解
2017/06/14 Javascript
Windows下快速搭建NodeJS本地服务器的步骤
2017/08/09 NodeJs
[js高手之路]图解javascript的原型(prototype)对象,原型链实例
2017/08/28 Javascript
vue二级菜单导航点击选中事件的方法
2018/09/12 Javascript
vuex直接赋值的三种方法总结
2018/09/16 Javascript
jQuery实现手风琴特效
2021/01/11 jQuery
[03:04]2018年度DOTA2玩家最喜爱的主播-完美盛典
2018/12/16 DOTA
在Mac OS系统上安装Python的Pillow库的教程
2015/11/20 Python
python 定义给定初值或长度的list方法
2018/06/23 Python
Python面向对象程序设计之类的定义与继承简单示例
2019/03/18 Python
python使用正则表达式(Regular Expression)方法超详细
2019/12/30 Python
Python接口测试环境搭建过程详解
2020/06/29 Python
Python调用C/C++的方法解析
2020/08/05 Python
亚马逊中国官方网站:amazon.cn
2017/05/25 全球购物
IGK Hair官网:喷雾、洗发水、护发素等
2020/11/03 全球购物
DJI全球:DJI Global
2021/03/15 全球购物
俄罗斯首家面向中国消费者的一站式购物网站:Wruru
2020/05/08 全球购物
C#里面如何倒序排列一个数组的元素?
2013/06/21 面试题
低碳环保倡议书
2014/04/14 职场文书
营销部内勤岗位职责
2014/04/30 职场文书
英语专业毕业生求职信
2014/05/24 职场文书
2014年国庆节演讲稿精选范文1500字
2014/09/25 职场文书
机关作风建设整改方案
2014/10/27 职场文书
个人委托书范文
2015/01/28 职场文书
幼儿园开学家长寄语(2016秋季)
2015/12/03 职场文书
大学生饮品店创业计划书范文
2019/07/10 职场文书