Python使用正则表达式抓取网页图片的方法示例


Posted in Python onApril 21, 2017

本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考,具体如下:

#!/usr/bin/python
import re
import urllib
#获取网页信息
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
#匹配网页中的图片
 reg = r'src="(.*?\.jpg)" alt'
  imgre = re.compile(reg)
  imglist = re.findall(imgre,html)
  x = 0
  for imgurl in imglist:
    urllib.urlretrieve(imgurl,'%s.jpg' % x)
    x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)
Python 相关文章推荐
python 通过字符串调用对象属性或方法的实例讲解
Apr 21 Python
python 借助numpy保存数据为csv格式的实现方法
Jul 04 Python
Python爬取成语接龙类网站
Oct 19 Python
python lxml中etree的简单应用
May 10 Python
Python匿名函数/排序函数/过滤函数/映射函数/递归/二分法
Jun 05 Python
通过pycharm使用git的步骤(图文详解)
Jun 13 Python
基于python二叉树的构造和打印例子
Aug 09 Python
解决Keras 与 Tensorflow 版本之间的兼容性问题
Feb 07 Python
django的模型类管理器——数据库操作的封装详解
Apr 01 Python
Python爬虫JSON及JSONPath运行原理详解
Jun 04 Python
Python numpy大矩阵运算内存不足如何解决
Nov 19 Python
PyCharm Community安装与配置的详细教程
Nov 24 Python
用python找出那些被“标记”的照片
Apr 20 #Python
python实现12306火车票查询器
Apr 20 #Python
Python编程修改MP3文件名称的方法
Apr 19 #Python
Python实现将罗马数字转换成普通阿拉伯数字的方法
Apr 19 #Python
Python连接SQLServer2000的方法详解
Apr 19 #Python
Django自定义插件实现网站登录验证码功能
Apr 19 #Python
Python列表切片用法示例
Apr 19 #Python
You might like
smarty高级特性之对象的使用方法
2015/12/25 PHP
PHP中addcslashes与stripcslashes函数用法分析
2016/01/07 PHP
PHP实现QQ登录实例代码
2016/01/14 PHP
Mootools 1.2教程 排序类和方法简介
2009/09/15 Javascript
表格单元格交错着色实现思路及代码
2013/04/01 Javascript
JS this作用域以及GET传输值过长的问题解决方法
2013/08/06 Javascript
js的匿名函数使用介绍
2013/12/11 Javascript
jQuery中的pushStack实现原理和应用实例
2015/02/03 Javascript
jQuery模拟新浪微博首页滚动效果的方法
2015/03/11 Javascript
Javascript中With语句用法实例
2015/05/14 Javascript
JavaScript实现点击单元格改变背景色的方法
2016/02/12 Javascript
JS组件Bootstrap实现下拉菜单效果代码
2016/04/26 Javascript
AngularJS 模块详解及简单实例
2016/07/28 Javascript
Javascript实现找不同色块的游戏
2017/07/17 Javascript
JavaScript设计模式之调停者模式实例详解
2018/02/03 Javascript
如何对react hooks进行单元测试的方法
2019/08/14 Javascript
vue实现点击追加选中样式效果
2019/11/01 Javascript
vue实现简单图片上传
2020/06/30 Javascript
python文件和目录操作方法大全(含实例)
2014/03/12 Python
Python实现把xml或xsl转换为html格式
2015/04/08 Python
使用Python的Scrapy框架十分钟爬取美女图
2016/12/26 Python
Python 循环语句之 while,for语句详解
2018/04/23 Python
Python字典对象实现原理详解
2019/07/01 Python
在PyCharm的 Terminal(终端)切换Python版本的方法
2019/08/02 Python
使用selenium和pyquery爬取京东商品列表过程解析
2019/08/15 Python
python3实现弹弹球小游戏
2019/11/25 Python
Django实现文章详情页面跳转代码实例
2020/09/16 Python
python入门教程之基本算术运算符
2020/11/13 Python
在vscode中启动conda虚拟环境的思路详解
2020/12/25 Python
如何用 Python 制作一个迷宫游戏
2021/02/25 Python
CSS3 制作旋转的大风车(充满童年回忆)
2013/01/30 HTML / CSS
初中新生军训方案
2014/05/13 职场文书
培训科主任岗位职责
2014/08/08 职场文书
客户答谢会致辞
2015/01/20 职场文书
导游词之永济鹳雀楼
2020/01/16 职场文书
详细谈谈JavaScript中循环之间的差异
2021/08/23 Javascript