Python使用正则表达式抓取网页图片的方法示例


Posted in Python onApril 21, 2017

本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考,具体如下:

#!/usr/bin/python
import re
import urllib
#获取网页信息
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
#匹配网页中的图片
 reg = r'src="(.*?\.jpg)" alt'
  imgre = re.compile(reg)
  imglist = re.findall(imgre,html)
  x = 0
  for imgurl in imglist:
    urllib.urlretrieve(imgurl,'%s.jpg' % x)
    x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)
Python 相关文章推荐
Python与Redis的连接教程
Apr 22 Python
python3读取excel文件只提取某些行某些列的值方法
Jul 10 Python
详解python:time模块用法
Mar 25 Python
Python实现的栈、队列、文件目录遍历操作示例
May 06 Python
python 命令行传入参数实现解析
Aug 30 Python
Python进度条的制作代码实例
Aug 31 Python
python绘制规则网络图形实例
Dec 09 Python
Python Selenium安装及环境配置的实现
Mar 17 Python
Python如何读取、写入JSON数据
Jul 28 Python
python实现暗通道去雾算法的示例
Sep 27 Python
Python 获取异常(Exception)信息的几种方法
Dec 29 Python
使用python+pygame开发消消乐游戏附完整源码
Jun 10 Python
用python找出那些被“标记”的照片
Apr 20 #Python
python实现12306火车票查询器
Apr 20 #Python
Python编程修改MP3文件名称的方法
Apr 19 #Python
Python实现将罗马数字转换成普通阿拉伯数字的方法
Apr 19 #Python
Python连接SQLServer2000的方法详解
Apr 19 #Python
Django自定义插件实现网站登录验证码功能
Apr 19 #Python
Python列表切片用法示例
Apr 19 #Python
You might like
十天学会php之第六天
2006/10/09 PHP
PHP5 的对象赋值机制介绍
2011/08/02 PHP
PHP采集类Snoopy抓取图片实例
2014/06/19 PHP
php读取XML的常见方法实例总结
2017/04/25 PHP
ThinkPHP5.1表单令牌Token失效问题的解决
2019/03/22 PHP
jquery 得到当前页面高度和宽度的两个函数
2010/02/21 Javascript
Javascript连接多个数组不用concat来解决
2014/03/24 Javascript
JavaScript中return false的用法
2015/03/12 Javascript
js实现按钮控制带有停顿效果的图片滚动
2016/08/30 Javascript
JQuery.validationEngine表单验证插件(推荐)
2016/12/10 Javascript
JavaScript实现格式化字符串函数String.format
2016/12/16 Javascript
使用jQuery实现一个类似GridView的编辑,更新,取消和删除的功能
2017/03/15 Javascript
详解webpack + vue + node 打造单页面(入门篇)
2017/09/23 Javascript
写给小白看的JavaScript异步
2017/11/29 Javascript
CentOS环境中MySQL修改root密码方法
2018/01/07 Javascript
JS 正则表达式验证密码、邮箱格式的实例代码
2018/10/28 Javascript
JS原型prototype和__proto__用法实例分析
2020/03/14 Javascript
[02:27]2018DOTA2亚洲邀请赛赛前采访-OpTic
2018/04/03 DOTA
python解决网站的反爬虫策略总结
2016/10/26 Python
利用Pandas读取文件路径或文件名称包含中文的csv文件方法
2018/07/04 Python
python中aioysql(异步操作MySQL)的方法
2019/04/11 Python
Python 给屏幕打印信息加上颜色的实现方法
2019/04/24 Python
简单的Python调度器Schedule详解
2019/08/30 Python
python实现飞机大战项目
2020/03/11 Python
Python如何把十进制数转换成ip地址
2020/05/25 Python
Html5 canvas画图白板踩坑
2020/06/01 HTML / CSS
h5移动端调用支付宝、微信支付的实现
2020/06/08 HTML / CSS
Max&Co官网:意大利年轻女性时尚品牌
2017/05/16 全球购物
毕业生应聘幼儿园的自荐信
2013/11/20 职场文书
小学生家长评语集锦
2014/01/30 职场文书
工商局局长个人对照检查材料思想汇报
2014/09/23 职场文书
2015年个人审计工作总结
2015/04/07 职场文书
退税申请报告怎么写
2015/05/18 职场文书
民间借贷被告代理词
2015/05/23 职场文书
Ajax实现局部刷新的方法实例
2021/03/31 Javascript
Python使用pyecharts控件绘制图表
2022/06/05 Python